购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 R语言中的数据读取和数据导出

本节主要介绍R语言中的数据读取和数据导出及其代码实现。

1.1.1 第一个R会话

R语言具有强大的数据统计与分析功能,如创建简单的数据集、输出数据集中的元素、提取数据集的子集、计算均值、计算方差等。为了提前感受R语言的强大功能,我们首先尝试一些简单的R语言操作:

构造完成后,x中包含2、5、8三个元素,q中包含2、5、8、2、5、8、6七个元素,我们接着通过索引输出x中的元素:

R语言中“:”可指示范围,如1:6表示1到6,4:8表示4到8等。

R语言中可调用mean()函数计算均值,sd()函数计算方差:

1.1.2 变量赋值

和其他编程语言一样,R语言中也存在符号变量。用户在创建变量时必须使用赋值运算符“<-”给变量赋值,赋值完成后,该变量才正式创建完成,R语言中不允许创建没有赋值的空变量。R语言中同样支持通过符号“=”进行赋值,二者在赋值上的效果一样,用户可根据自身喜好选择。

下面语句创建了一个变量x0,并将其赋值为2:

变量创建完成后,该变量便代表了用户赋予的数值。用户可通过赋值运算符“<-”对变量重新赋值,以达到修改变量值的目的。

1.1.3 从文件中读取数据

想要从外部文件中直接读取整个数据框,文件通常需要具备特殊的格式:文件的第一行应该为数据框中的每列变量命名,其余行包括一个行标签以及每个变量的取值。图1-1为csv文件的格式示例。

常用的读取文件数据的函数包括read.table()、read.csv()、read.delim()等。首先来看一个例子:

read.table()函数中的第一个参数为要读取文件的路径及名称,header用于指出文件的第一行是否为变量的名字,其默认值为FALSE。除了上述三种函数外,R语言还可以直接读取Excel文件,具体代码如下:

图1-1 csv文件的格式示例

1.1.4 从R语言的包中获取数据

在R语言中,我们不仅可以从文件中读取数据,还可以从R语言的包中获取数据。调用函数data()可以查看datasets包中的数据集,如图1-2所示。

图1-2 datasets包中的部分数据集

我们同样可以对这些数据进行处理分析。下面展示如何计算数据集Nile的均值和标准差:

1.1.5 导出数据

根据导出文件格式的不同,存在多种文件导出函数。write.table()、write.csv()、write.xlsx()等函数可用于将程序中的数据导出到指定的文件夹,具体代码如下:

上述函数中的第一个参数为待导出的数据集,第二个参数为导出文件的路径及名称,sep为数据的分隔符。 PygeI+GmC8Yjj5rKWEP4RVTjrSW2mZTdPmK1ezaz64QfYv06EMjAh7AkiXUutC66

点击中间区域
呼出菜单
上一章
目录
下一章
×