购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

练习题

一、思考题

1.阐述大数据处理的流程。

2.举例说明大数据的关键技术。

3.HDFS中的名称节点和数据节点的功能是什么?

4.阐述HDFS在正常情况下写文件的过程。

5.数据清洗包含哪些内容?

6.健康医疗大数据面临哪些安全挑战和隐私泄露风险?

7.举例说明区块链技术在医疗大数据存储和共享中的应用。

二、选择题

1.HDFS中block默认保存( )份。

A. 1

B. 2

C. 3

D. 4

2.HDFS中负责保存文件数据的节点被称为( )。

A.名称节点

B.数据节点

C.第二名称节点

D.节点管理器

3.一个Hadoop集群(2.2.7版本),在不修改默认配置的情况下存储30个mp4文件,每个文件200M,HDFS集群会产生( )个block(包括副本)。

A. 30

B. 60

C. 100

D. 180

4.噪声数据主要包括错误数据和( )数据。

A.异常数据

B.真实数据

C.污染数据

D.以上都对

5.假设12个销售价格记录组已经排序如下:6,10,11,13,15,36,50,55,72,92,204,215,将它们等频划分成3个箱,要求:箱1用平均值,箱2用中位值,箱3用箱边界三种方法来平滑噪声数据,下面( )是正确的。

A. 11,11,11;43,43,43;72,215,215,215

B. 10,10,10;43,43,43;72,72,215,215

C. 10,10,10;36,36,36;72,72,215,215

D. 10,10,10;43,43,43;72,72,72,72 5OO7NIvYtCRCsl/pBRQ6lWQb+DDsTjPYHiL0NZb316Gz45x/Hs0LkbttJ753EWc9

点击中间区域
呼出菜单
上一章
目录
下一章
×