购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

本章小结

1.大数据的处理流程包括数据采集、数据预处理、数据存储、数据分析、数据可视化及数据应用等环节。

2.大数据平台框架自下向上包括数据采集层、数据处理层、数据分析层、数据访问层、应用层,还包括一个纵向的管理平台层。

3.大数据平台采用分布式存储方式解决大数据存储的单机容量限制问题,采用分布式计算方式解决计算力和计算资源的限制问题。

4.Hadoop是事实上的大数据平台标准,核心部分包括分布式文件系统HDFS和并行分布式编程计算框架MapReduce。

5.大数据的预处理技术包括数据清洗、数据集成和数据转换。

6.与大数据生命周期对应的大数据隐私保护技术包括匿名保护、数据存储加密、数据审计、大数据访问控制技术等。

7.区块链技术具有可追溯、不可篡改的特征,作为一种信任机制可以缓解用户对数据平台安全和隐私保护方面的忧虑,将区块链技术应用于大数据存储和共享成为新趋势。

(诸 强) Yu2tNT69SyVCZC7WalqZEK+Y8e/rQOybpwSfhqClhCZ2cuZZHkhhJnYOxvW69kdE

点击中间区域
呼出菜单
上一章
目录
下一章
×