



一、选择题
1.朴素贝叶斯分类器属于( )模型。
A.判别模型
B.生成模型
C.预算模型
D.统计模型
2.( )算法在数据量较少的情况下,仍然能较准确地对数据进行分类。
A.k近邻
B.支持向量机
C.朴素贝叶斯
D.人工神经网络
3.关于朴素贝叶斯分类算法,描述正确的是( )。
A.朴素贝叶斯需要大量数据训练才能较准确地对测试样本进行分类
B.朴素贝叶斯分类算法只能处理非连续型数据
C.朴素贝叶斯假设样本特征之间相互独立
D.朴素贝叶斯在分类时需要计算各种类别的概率
4.不属于朴素贝叶斯分类算法优点的是( )。
A.对小规模的数据表现很好,能处理多分类任务,适合增量式训练
B.对缺失数据不太敏感,算法也比较简单,常用于文本分类
C.具有可解释性
D.适合处理样本属性有关联的数据
    5.根据西瓜数据集第一条记录特征,预测其是好瓜还是坏瓜时,先验概率
    
    ,
    
    ,请计算类条件概率
    
     P
    
    (色泽=青绿|好瓜)、
    
     P
    
    (纹路=清晰|坏瓜)。下列计算结果正确的是( )。
   
   A.0.375,0.625
B.0.375,0.222
C.0.222,0.750
D.0.333,0.875
二、算法分析题
1.编写算法,编写一个朴素贝叶斯分类器,并对鸢尾花数据进行分类。
2.对于表3-3中的样本,假设这些样本特征都是相互独立的,请训练一个朴素贝叶斯分类器,并预测样本 x =(2, S ) T 是属于哪一类的?
表3-3 训练样本
   其中,X1、X2为样本数据特征,y为标签。