统计学习方法（第2版）最新章节_李航著

参考文献

[1]Cover T, Hart P. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 1967, 13（1）：21–27.

[2]Hastie T, Tibshirani R, Friedman J. The elements of statistical learning：data mining, inference, and prediction, 2001.（中译本：统计学习基础——数据挖掘、推理与预测．范明，柴玉梅，昝红英等译．北京：电子工业出版社，2004．）

[3]Friedman J. Flexible metric nearest neighbor classification. Technical Report, 1994.

[4]Weinberger K Q, Blitzer J, Saul L K. Distance metric learning for large margin nearest neighbor classification. In: Proceedings of the NIPS. 2005.

[5]Samet H. The design and analysis of spatial data structures. Reading, MA：Addison-Wesley, 1990.

[1] kd 树是存储 k 维空间数据的树结构，这里的 k 与 k 近邻法的 k 意义不同，为了与习惯一致，本书仍用 kd 树的名称。

[2] x ⁽¹⁾ =6是中位数，但 x ⁽¹⁾ =6上没有数据点，故选 x ⁽¹⁾ =7。

朴素贝叶斯（naïve Bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入输出的联合概率分布；然后基于此模型，对给定的输入 x ，利用贝叶斯定理求出后验概率最大的输出 y 。朴素贝叶斯法实现简单，学习与预测的效率都很高，是一种常用的方法。

本章叙述朴素贝叶斯法，包括朴素贝叶斯法的学习与分类、朴素贝叶斯法的参数估计算法。

4.1　朴素贝叶斯法的学习与分类

4.1.1　基本方法

设输入空间 X ⊆ R ⁿ 为 n 维向量的集合，输出空间为类标记集合 Y ={ c ₁ , c ₂ ,…, c _K }。输入为特征向量 x ∈ X ，输出为类标记（class label） y ∈ Y 。 X 是定义在输入空间 X 上的随机向量， Y 是定义在输出空间 Y 上的随机变量。 P （ X , Y ）是 X 和 Y 的联合概率分布。训练数据集