购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
数据预处理

在对数据进行使用前,首先要确保其结构良好、准确可靠。这就是数据预处理过程,包括数据的收集、清洗、整合等一系列步骤。

大数据体量极大,以至于我们无法在单个计算机上对其进行存储和计算。为此,我们需要完成大规模计算系统的搭建,这就需要用到Hadoop和MapReduce。 sEIw979a1tF8uK1g7UX8wbLUYmibwa29MPVYmtfaR0CvkBzo8nK3BNCMcKiSr6ti

点击中间区域
呼出菜单
上一章
目录
下一章
×