购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.7 生成模型与判别模型

监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测相应的输出。这个模型的一般形式为决策函数:

或者条件概率分布:

监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative approach)。所学到的模型分别称为生成模型(generative model)和判别模型(discriminative model)。

生成方法原理上由数据学习联合概率分布 P X , Y ),然后求出条件概率分布 P Y | X )作为预测的模型,即生成模型:

这样的方法之所以称为生成方法,是因为模型表示了给定输入 X 产生输出 Y 的生成关系。典型的生成模型有朴素贝叶斯法和隐马尔可夫模型,将在后面章节进行相关讲述。

判别方法由数据直接学习决策函数 f X )或者条件概率分布 P Y | X )作为预测的模型,即判别模型。判别方法关心的是对给定的输入 X ,应该预测什么样的输出 Y 。典型的判别模型包括: k 近邻法、感知机、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法和条件随机场等,将在后面章节讲述。

在监督学习中,生成方法和判别方法各有优缺点,适合于不同条件下的学习问题。

生成方法的特点:生成方法可以还原出联合概率分布 P X , Y ),而判别方法则不能;生成方法的学习收敛速度更快,即当样本容量增加的时候,学到的模型可以更快地收敛于真实模型;当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用。

判别方法的特点:判别方法直接学习的是条件概率 P Y | X )或决策函数 f X ),直接面对预测,往往学习的准确率更高;由于直接学习 P Y | X )或 f X ),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。 znBAyUscV+qxaEVvT1TrcGlicnNjnh+jCxoQgwa6QpfJA1nXF8A1UHd3Ap74xQxu

点击中间区域
呼出菜单
上一章
目录
下一章
×