购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5 数据准备

1.5.1 数据集介绍

学生成绩统计分析的数据主要来源于某高中学生成绩表,包括“成绩表.xlsx”和“测试成绩.xlsx”,如图1.12所示。

图1.12 学生成绩统计分析的数据文件

部分数据截图如图1.13和图1.14所示。

图1.13 “成绩表.xlsx”部分数据截图

图1.14 “测试成绩.xlsx”部分数据截图

说明

“成绩表.xlsx”和“测试成绩.xlsx”位于资源包项目所在的文件夹,开发本项目前应首先将它们复制到项目文件夹中,如图1.15所示。

图1.15 将数据文件复制到项目文件夹

1.5.2 读取数据

在了解了数据集后,接下来读取数据,主要使用openxlsx包的read.xlsx()函数,实现过程如下(源码位置:资源包\Code\01\view_data.R)。

(1)在项目文件夹(“学生成绩统计分析”文件夹)中新建一个R脚本文件,命名为view_data.R。

(2)使用openxlsx包的read.xlsx()函数读取Excel文件,代码如下:

# 加载程序包
library(openxlsx)
# 读取Excel 文件
df <- read.xlsx("学生成绩统计分析/成绩表.xlsx",sheet=1)

(3)显示前6条数据,代码如下:

# 显示前 6 条数据
head(df)

运行程序,结果如图1.16所示。

图1.16 显示前6条数据

还可以以表格的形式显示数据,代码如下:

View(df)

运行程序,结果如图1.17所示。

比起图1.16,图1.17中的数据看上去更清晰更直观。不仅如此,通过数据查看器还可以实现数据筛选和排序。例如,筛选“数学”成绩100~120的数据,第1步单击Filter,第2步单击“数学”文本框,第3步在直方图中单击数据区间,如100-120,如图1.18所示,之后将显示筛选结果,如图1.19所示。

图1.17 在数据查看器中显示数据

图1.18 筛选“数学”成绩100~120的数据

图1.19 筛选结果

也可以在右侧的Environment面板中单击 图标启动数据查看器,如图1.20所示。

图1.20 启动数据查看器 F0rZdRQq2Sx1rQk+WUNfYnjRa7FwZRvC3xeZZQR0/q7sgHz68N6T+eL9ni2x6XoJ

点击中间区域
呼出菜单
上一章
目录
下一章
×