统计学习方法（第2版）最新章节_李航著_掌阅小说网

下载掌阅APP，畅读海量书库

立即打开

畅读海量书库

扫码下载掌阅APP

4.2　朴素贝叶斯法的参数估计

4.2.1　极大似然估计

在朴素贝叶斯法中，学习意味着估计 P （ Y = c _k ）和 P （ X ⁽ ^j ⁾ = x ⁽ ^j ⁾ | Y = c _k ）。可以应用极大似然估计法估计相应的概率。先验概率 P （ Y = c _k ）的极大似然估计是

设第 j 个特征 x ⁽ ^j ⁾ 可能取值的集合为{ a _j ₁ , a _j ₂ ,…, a _jSj }，条件概率 P （ X ⁽ ^j ⁾ = a _jl | Y = c _k ）的极大似然估计是

式中，是第 i 个样本的第 j 个特征； a _jl 是第 j 个特征可能取的第 l 个值； I 为指示函数。

4.2.2　学习与分类算法

下面给出朴素贝叶斯法的学习与分类算法。

算法4.1（朴素贝叶斯算法（naïve Bayes algorithm））

输入：训练数据 T ={（ x ₁ , y ₁ ）,（ x ₂ , y ₂ ）,…,（ x _N , y _N ）}，其中是第 i 个样本的第 j 个特征，， a _jl 是第 j 个特征可能取的第 l 个值， j =1,2,…, n ， l =1,2,…, S _j ， y _i ∈{ c ₁ , c ₂ ,…, c _K }；实例 x ；

输出：实例 x 的分类。

（1）计算先验概率及条件概率

（2）对于给定的实例 x =（ x ⁽¹⁾ , x ⁽²⁾ ,…, x ⁽ ⁿ ⁾ ） ^T ，计算

（3）确定实例 x 的类

例4.1 试由表4.1的训练数据学习一个朴素贝叶斯分类器并确定 x =（2, S ） ^T 的类标记 y 。表中 X ⁽¹⁾ ， X ⁽²⁾ 为特征，取值的集合分别为 A ₁ ={1,2,3}， A ₂ ={ S,M,L} ， Y 为类标记， Y∈C ={1,−1}。

表4.1　训练数据

解根据算法4.1，由表4.1，容易计算下列概率：

对于给定的 x =（2, S ） ^T 计算：

因为 P （ Y =−1） P （ X ⁽¹⁾ =2| Y =−1） P （ X ⁽²⁾ = S | Y =−1）最大，所以 y =−1。

4.2.3　贝叶斯估计

用极大似然估计可能会出现所要估计的概率值为0的情况。这时会影响到后验概率的计算结果，使分类产生偏差。解决这一问题的方法是采用贝叶斯估计。具体地，条件概率的贝叶斯估计是

式中 λ ≥0。等价于在随机变量各个取值的频数上赋予一个正数 λ >0。当 λ =0时就是极大似然估计。常取 λ =1，这时称为拉普拉斯平滑（Laplacian smoothing）。显然，对任何 l =1,2,…, S _j ， k =1,2,…, K ，有

表明式（4.10）确为一种概率分布。同样，先验概率的贝叶斯估计是

例4.2 问题同例4.1，按照拉普拉斯平滑估计概率，即取 λ =1。

解 A ₁ ={1,2,3}， A ₂ ={ S,M,L} ， C ={1,−1}。按照式（4.10）和式（4.11）计算下列概率：

对于给定的 x =（2, S ） ^T ，计算：

由于 P （ Y =−1） P （ X ⁽¹⁾ =2| Y =−1） P （ X ⁽²⁾ = S | Y =−1）最大，所以 y =−1。

点击中间区域
呼出菜单

购买书籍时，会优先扣除您的代金券，再扣除阅饼；当您的余额不足时，可使用微信或支付宝支付，补足差价；
连载书籍勾选自动购买下一章后，会自动扣费，已购章节不会重复扣费；
书籍购买记录请至我的—购书记录中查询

上一章

目录

下一章

×