购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
数据预处理

在对数据进行使用前,首先要确保其结构良好、准确可靠。这就是数据预处理过程,包括数据的收集、清洗、整合等一系列步骤。

大数据体量极大,以至于我们无法在单个计算机上对其进行存储和计算。为此,我们需要完成大规模计算系统的搭建,这就需要用到Hadoop和MapReduce。 Dtm/0r7EpQvJ1H2abPJnEi518Ra2imzCPIA6c590iBFXz25m8Y7sfX4VToDDA02b

点击中间区域
呼出菜单
上一章
目录
下一章
×