模式识别与智能计算—MATLAB技术实现（第3版）最新章节_杨淑莹著

1.3.2 统计模式识别方法简介

基于统计模式识别方法有多种方法：例如模板匹配法、判别函数法、神经网络分类法、基于规则推理法等。这些方法各有特点及应用范围，它们不能相互取代，只能共存，相互促进、借鉴、渗透。一个较完善的识别系统很可能是综合利用上述各类识别方法的观点、概念和技术而形成的。

1.模板匹配

模板匹配的原理是选择已知的对象作为模板，与待测物体进行比较，从而识别目标。将待分类样品与标准模板进行比较，看跟哪个模板匹配程度更好些，从而确定待测试样品的分类。而近邻法则在原理上属于模板匹配。它将训练样品集中的每个样品都作为模板，用测试样品与每个模板做比较，看与哪个模板最相似（即为近邻），就按最近似的模板的类别作为自己的类别。譬如 A 类有10个训练样品，因此有10个模板， B 类有8个训练样品，就有8个模板。任何一个待测试样品在分类时与这18个模板都算一算相似度，如最相似的那个近邻是 B 类中的一个，就确定待测试样品为 B 类，否则为 A 类。因此原理上说近邻法是最简单的。但是近邻法有一个明显的缺点就是计算量大，存储量大，要存储的模板很多，每个测试样品要对每个模板计算一次相似度，因此在模板数量很大时，计算量也是很大的。模板匹配的另一个缺点是由于匹配的点很多，理论上最终可以达到最优解，但在实际中却很难做到。模板匹配主要应用于对图像中对象物位置的检测，运动物体的跟踪，不同光谱或者不同摄影时间所得的图像之间位置的配准等。模板匹配的计算量很大，相应的数据的存储量也很大，而且随着图像模板的增大，运算量和存储量以几何级数增长。如果图像和模板大到一定程度，就会导致计算机无法处理，随之也就失去了图像识别的意义。

2.判别函数

设计判别函数的形式有两种方法：基于概率统计的分类法和几何分类法。

（1）基于概率统计的分类器

基于概率统计的分类器主要有基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策。

直接使用贝叶斯决策需要首先得到有关样品总体分布的知识，包括各类先验概率 P （ ω ₁ ）及类条件概率密度函数，计算出样品的后验概率，并以此作为产生判别函数的必要数据，设计出相应的判别函数与决策面。当各类样品近似于正态分布时，可以算出使错误率最小或风险最小的分界面，以及相应的分界面方程。因此如果能从训练样品估计出各类样品服从近似的正态分布，可以按贝叶斯决策方法对分类器进行设计。

这种利用训练样品的方法是通过它的概率分布进行估计，然后用它进行分类器设计，这种方法则称为参数判别方法。它的前提是对特征空间中的各类样品的分布已很清楚，一旦要测试分类样品的特征向量值 X 已知，就可以确定 X 对各类的后验概率，也就可按相应的准则计算与分类。所以判别函数等的确定取决于样品统计分布的有关知识。因此参数分类判别方法一般只能用在有统计知识的场合，或能利用训练样品估计出参数的场合。

贝叶斯分类器可以用一般的形式给出数学上严格的分析证明：在给出某些变量的条件下，能使分类所造成的平均损失最小，或者分类决策的风险最小。因此能计算出分类器的极限性能。贝叶斯决策采用分类器中最重要的指标——错误率作为产生判别函数和决策面的依据，因此它给出了最一般情况下适用的“最优”分类器设计方法，对各种不同的分类器设计技术在理论上都有指导意义。

（2）判别函数分类法

由于一个模式通过某种变换映射为一个特征向量后，该特征向量可以理解为特征空间的一个点，在特征空间中，属于一个类的点集，总是在某种程度上与属于另一个类的点集相分离，各个类之间确定可分的，因此如果能够找到一个判别函数（线性或非线性函数），把不同类的点集分开，则分类任务就解决了。判别分类器不依赖于条件概率密度的知识，可以理解为通过几何的方法，把特征空间分解为对应于不同类别的子空间。而且呈线性的分离函数，将使计算简化。分离函数又分为线性判别函数和非线性判别函数。

3.神经网络分类

人工神经网络的研究起源于对生物神经系统的研究。它将若干处理单元（即神经元）通过一定的互连模型连结成一个网络，这个网络通过一定的机制可以模仿人的神经系统的动作过程，以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解，具有一定的智能化处理的特点。神经网络侧重于模拟和实现人认知过程中的感知觉过程、形象思维、分布式记忆、自学习和自组织过程，与符号处理是一种互补的关系。但神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习的能力，特别适用于处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。

神经网络可以看成是从输入空间到输出空间的一个非线性映射，它通过调整权重和阈值来“学习”或发现变量间的关系，实现对事务的分类。由于神经网络是一种对数据分布无任何要求的非线性技术，它能有效解决非正态分布、非线性的评价问题，因而得到广泛的应用。由于神经网络具有信息的分布存储，并行处理及自学习能力等特点，它在泛化处理能力上显示出较高的优势，可处理一些环境信息十分复杂，背景知识不清楚，推理规则不明确的问题。允许样品有较大的缺损、畸变。缺点是目前能识别的模式类还不够多，模型在不断丰富与完善中。

4.基于规则推理法

基于规则推理法是对待识客体运用统计（或结构、模糊）识别技术，或人工智能技术，获得客体的符号性表达即知识性事实后，运用人工智能技术对知识的获取、表达、组织、推理方法，确定该客体所归属的模式类（进而使用）的方法。它是一种与统计模式识别、句法模式识别相并列（又相结合）的基于逻辑推理的智能模式识别方法。它主要包括知识表示、知识推理和知识获取三个环节。

通过样本训练集构建推理规则进行模式分类的方法主要有：决策树和粗糙集理论。决策树学习是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则的实例中推理出决策树表示形式的分类规则。决策树整体为一棵倒长的树，分类时，采用自顶向下的递归方式，在决策树的内部结点进行属性值的比较并根据不同属性判断从该结点向下的分支，在决策树的叶结点得到结论。粗糙集理论反映了认知过程在非确定、非模型信息处理方面的机制和特点，是一种有效的非单调推理工具。粗糙集以等价关系为基础，用上、下近似两个集合来逼近任意一个集合，该集合的边界区域被定义为上近似集和下近似集之差集，边界区域就是那些无法归属的个体。上、下近似两个集合可以通过等价关系给出确定的描述，边界域的元素数目可以被计算出来。这两个理论在数据的决策和分析、模式识别、机器学习与知识发展等方面有着成功的应用，已成为信息科学最活跃的研究领域之一。

基于规则推理法适用于已建立了关于知识表示与组织、目标搜索及匹配的完整体系。对需通过众多规则的推理达到识别确认的问题，有很好的效果。但是当样品有缺损，背景不清晰，规则不明确甚至有歧义时，效果不好。

5.模糊模式识别法

模糊模式识别的理论基础是模糊数学。它根据人辨识事物的思维逻辑，吸取人脑的识别特点，将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度即隶属度来表示的，一个对象可以在某种程度上属于某一类别，而在另一种程度上属于另一类别。一般常规识别方法则要求一个对象只能属于某一类别。基于模糊集理论的识别方法有：最大隶属原则识别法、择近原则识别法和模糊聚类法。由于用隶属度函数作为样品与模块间相似程度的度量，故往往能反映它们整体的和主要的特性，从而允许样品有相当程度的干扰与畸变。但准确合理的隶属度函数往往难以建立，故限制了它的应用。伴随着各门学科，尤其是人文、社会学科及其他“软科学”的不断发展，数学化、定量化的趋势也开始在这些领域中显现。模糊模式识别不再简单局限于自然科学的应用，同时也被应用到社会科学，特别是经济管理学科方面。

6.支持向量机的模式识别

支持向量机（Support Vector Machine,SVM）方法是求解模式识别和函数估计问题的有效工具，是由Vapnik领导的AT＆Bell实验室研究小组在1963年提出的一种新的非常有潜力的分类技术，其基本思想是：先在样本空间或特征空间，构造出最优超平面，使得超平面与不同类样本集之间的距离最大，从而达到最大的泛化能力。支持向量机结构简单，并且具有全局最优性和较好的泛化能力，自提出以来得到了广泛的研究。

支持向量机在数字图像处理方面的应用是寻找图像像素之间的特征的差别，即从像素点本身的特征和周围的环境（临近的像素点）出发，寻找差异，然后将各类像素点区分出来。

上述的各种方法各有特点及应用范围，它们不能相互取代，可以取长补短，互相补充、促进、借鉴、渗透。一个较完善的识别系统很可能是综合利用上述各类识别方法的观点、概念和技术而形成的。