R入门笔记2

续上一篇R快速入门笔记,本文是最近学习R的一些笔记心得。

1. 常见数值计算函数

log(e) 默认是以e为底的自然对数。如果以10为底则修改第二个参数即可。exp是e的指数函数,其他的指数计算直接用x^n即可,例如:

2. 数列、数组

rep(): 输入重复元素

3. 数据框

数据狂是一个类似关系数据库表的数据结构,其中每列的数据类型可以不同,但是数据长度必须一致。数据框非常适合用于数据分析,它的每一列可以代表数据的每个标量或属性,每一行代表一个样本。例如:

多个条件使用&,|和!来表示。

mean(people$age) 平均年龄
names(people)
nrow(people)
按排序显示:

实用factor因子来定义标签,可以重新定义标签值

可以用attach将数据框中的符号引入到全局空间中:

4. 列表

列表(List)是非常灵活的数据结构,它的不同元素可以是不同类型(每个元素可以当作一个R中的变量),也可以是不同的长度。

另外使用list的常用场景是lapply, 调用函数的每一个返回值都会作为list中的成员:

5. 几个矩阵相关操作

(1). cbind()让若干向量以列的方式拼成, rbind()以行(row)
(2). 对矩阵一行/列来赋值

(3). 同时对多个向量执行同一个操作

(4). 取值形成矩阵

6. 向量相关

(1). sum, min, max & prod 与 cumsum, cumprod, cummin, cummax
(2). split函数可以根据某一列/某一条件来拆分

(3). order用于获得某一向量有序的索引,例如

7. 其他

(1). sapply是simplify了的lapply,所谓的simplify,是指对结果的数据结构进行了simplify,方便后续处理。

sapply(scores, mean)
YuWen ShuXue
83.0 86.2
sapply(scores, quantile, probs=c(0.5,0.7,0.9))
YuWen ShuXue
50% 84.0 87.0
70% 88.6 96.6
90% 92.2 99.6

(2). tapply用于接收一系列向量并形成table,例如:

(3). apply中都有一个na.rm=TRUE选项,用于排除迭代向量中的NA值。
(4). R studio的source编辑页面可以用ctrl+n来执行
(5). 条件函数 *ifelse(条件,当条件满足时执行,当条件失败时执行)
等同于 if() {…} else {…}

参考

《R语言核心编程手册》
《R统计学入门》

Posted in Dev, Python|R.
  1. Pingback: ray bans sunglasses

  2. 记得那年,天,正下着小雨,我和他撑着一把伞漫步雨中,他偷偷的看着我,一路无话,等他送我到校门口的时候他扭扭捏捏地从 裤兜里掏出桃红色的信封,就在我快要抱着他大声喊“我爱你”的时候,他说“请把它交给你哥”然后我就腐了…… 一个程序员社区 http://www.1024xyz.com