购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2

readr
——进阶数据读取

'eadr'包是R语言世界级大神之一Hadley Wickham主导开发的一个数据读取包。相较于'utils'包里的读取函数,'readr'包主要拥有三点优势,具体如下。

1)更快。就平均读取速度而言,'readr'包里的'read_csv'一般要比'read.csv'快三到十倍不等。

2)默认设置更简洁。默认情况下,'readr'包会自动解析每列的数据类型,并显示解析结果,这样可以更加直观地看到读取后的数据类型是否符合预期,而且无须设置'stringAsFactors'。

3)对数据类型的解析更准确。'utils'包中提供的'read.table'函数在甄别一列数据的属性时,只会对起始5行的观测值类型进行评估,并以此决定该列全部数据的类型。而'readr'中的函数默认评估1000行的观测值后再决定数据的类型。

'readr'包中常用的数据读书取函数包括'read_delim'、'read_fwf'、'read_lines'、'read_log'和'read_table'。其中'read_delim'属于常见数据读取'read_csv/read_csv2/read_tsv'的母函数,所以也可以直接调用子函数。 cbi5MR/aYVtyiBtjA6xgRvCODRCpj08aQMdUn19ZDUcFLkX4RHjcX5eaRdD9StnW

点击中间区域
呼出菜单
上一章
目录
下一章
×