购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.5 数据框

数据框是R语言中非常常用的数据结构,它是一个表格形式的数据对象,类似于电子表格或SQL数据库中的表。数据框如图3-14所示。数据框由行和列组成,每列可以包含不同的数据类型(如字符、数值、因子等)。数据框通常用于存储和处理结构化数据,如实验数据、统计数据、观察结果等。

图3-14 数据框

数据框有以下几个关键特点。

(1)数据框中的每一列都需要有一个唯一的列名,这是访问列数据的关键。

(2)数据框中每一列的长度(行数)需要相同,这样每一行都有完整的数据。

(3)数据框要求同一列中的每个元素必须是相同的数据类型,比如全为数值或者全为字符等。

(4)数据框不同列可以包含不同类型的数据。

3.5.1 创建数据框

要创建数据框,我们可以使用 data.frame() 函数。以下是创建数据框的基本语法。

说明如下。

df 是为数据框指定的名称,我们可以自行命名。

列名1,列名2,...是为数据框的各列指定的列名。

向量1,向量2,...是包含数据的向量,这些向量将成为数据框的列。

以下是展示创建一个包含学生信息的数据框的示例代码。

上述代码创建一个名为students的数据框,包含了 Name、Age 和 Pass 三列,分别表示学生的姓名、年龄和是否通过。

上述示例代码运行结果如下。

3.5.2 从数据框中提取数据

从数据框中提取数据是R语言中的常见操作,通常需要根据分析的需要选择特定的行和列。以下是从数据框中提取数据的常用方法。

(1)提取列:通过列名来选择特定的列,可以使用$运算符或双方括号[[]]运算符。

(2)提取行:通过行的索引位置来选择特定的行。

(3)组合提取:可以同时选择行和列来提取数据。

(4)集化:使用不同的函数(如 subset())和条件来创建数据的子集。

示例代码如下。

上述示例代码运行结果如下。

3.5.3 添加行和列

在R语言中,可以通过不同的方法来添加新的行和列到已存在的数据框中。以下是添加行和列的常用方法。

(1)添加新列:可以使用$运算符来创建并添加新列。

(2)添加新行:可以使用rbind()函数将新的数据行添加到已存在的数据框中。

示例代码如下。

上述示例代码解释如下。

代码第①行创建一个数据框 students 包含三列:姓名(Name)、年龄(Age)、成绩等级(Grade)。

代码第②行使用$运算符添加一个新的列 Score,该列包含学生的分数信息。

代码第③行创建一个新的数据框new_student,表示一个名为Eva的新学生的信息,包括姓名、年龄、成绩等级和分数。

代码第④行使用rbind()函数将新学生的信息添加到现有的 students 数据框中,从而添加了一行新的数据。

上述示例代码运行结果如下。

3.5.4 删除行和列

在R语言中,我们可以使用不同的方法来删除数据框中的行和列。以下是删除行和列的常用方法。

(1)删除列:可以使用$运算符将列设置为NULL,从而删除列。

(2)删除行:可以使用负数索引来删除指定的行。

示例代码如下。

上述示例代码运行结果如下。 jVq1kMaNp/RDMwwEzLEW9zo6EixLgCYxelG3Q1Jaq1ufvP06uzNZBh7edK15/2e2

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开