1.阐述大数据处理的流程。
2.举例说明大数据的关键技术。
3.HDFS中的名称节点和数据节点的功能是什么?
4.阐述HDFS在正常情况下写文件的过程。
5.数据清洗包含哪些内容?
6.健康医疗大数据面临哪些安全挑战和隐私泄露风险?
7.举例说明区块链技术在医疗大数据存储和共享中的应用。
1.HDFS中block默认保存( )份。
A. 1
B. 2
C. 3
D. 4
2.HDFS中负责保存文件数据的节点被称为( )。
A.名称节点
B.数据节点
C.第二名称节点
D.节点管理器
3.一个Hadoop集群(2.2.7版本),在不修改默认配置的情况下存储30个mp4文件,每个文件200M,HDFS集群会产生( )个block(包括副本)。
A. 30
B. 60
C. 100
D. 180
4.噪声数据主要包括错误数据和( )数据。
A.异常数据
B.真实数据
C.污染数据
D.以上都对
5.假设12个销售价格记录组已经排序如下:6,10,11,13,15,36,50,55,72,92,204,215,将它们等频划分成3个箱,要求:箱1用平均值,箱2用中位值,箱3用箱边界三种方法来平滑噪声数据,下面( )是正确的。
A. 11,11,11;43,43,43;72,215,215,215
B. 10,10,10;43,43,43;72,72,215,215
C. 10,10,10;36,36,36;72,72,215,215
D. 10,10,10;43,43,43;72,72,72,72