1.数据分类一般分为哪两个阶段?常用的评估分类方法准确率的技术有哪些?
2.什么是决策树?决策树的最佳用途是什么?决策树分为哪两种树?决策树中一般包含哪几种节点?决策树构建的基本步骤是什么?一棵决策树的生成过程主要分为哪3个部分?决策树的优缺点是什么?
3.ID3算法生成决策树的过程是什么?请阐述 ID3算法的优缺点。C4.5算法有哪两种基本剪枝策略?请分别阐述它们的思路。C4.5算法建树过程是什么?请阐述C4.5算法的优缺点。请阐述CART算法的建树过程,以及CART算法的优缺点。
4.请阐述朴素贝叶斯分类的优缺点。整个朴素贝叶斯分类一般分为哪三个阶段?贝叶斯分析中的三要素是指哪三要素?贝叶斯决策主要包含哪四个部分?
5.什么叫核函数?常用的核函数主要有哪几种?对偶问题与原问题之间存在哪些关系?请阐述对偶理论。常用的损失函数有哪些?
6.请阐述支持向量机的主要思想。支持向量机的理论有哪几个要点?支持向量机(SVM)主要有哪几种情况?请阐述支持向量机的优点。