数据操作是R语言的一大优势,用户可以利用基本包或者拓展包在R语言中进行复杂的数据操作,包括排序、更新、分组汇总等。新一代的R程序包不仅易读易写,而且快速高效,非常适合用来处理规模较大的数据。考虑到机器学习往往需要对大量的数据进行训练,本章内容将主要介绍 data.table 和 tidyfst 两个扩展包,并根据任务结合其他R包资源,对如何在R语言中实现灵活高效的数据操作进行讲解。 MzId9bUIkcnUBL2ZLTqJJMHQfAKyd24mkuClEimz4TpyDg21nMVnyGNv/91Zhrao
data.table
tidyfst