模式识别方法(Pattern Recognition Method)是一种借助于计算机对信息进行处理、判决分类的数学统计方法。应用模式识别方法的首要步骤是建立模式空间。所谓模式空间是指在考察一客观现象时,影响目标的众多指标构成的多维空间。模式识别就是对多维空间中各种模式的分布特点进行分析,对模式空间进行划分,识别各种模式的聚类情况,从而做出判断或决策。分析方法就是利用“映射”和“逆映射”技术。映射是指将多维模式空间通过数学变换到二维平面,多维空间的所有模式(样本点)都投影在该平面内。在二维平面内,不同类别的模式分布在不同的区域之间有较明显的分界域。由此确定优化方向返回到多维空间(原始空间),得出真实信息,帮助人们找出规律或做出决策,指导实际工作或实验研究。
在 d 维特征空间已经确定的前提下,讨论分类器设计问题,其实是一个选择什么准则、使用什么方法,并将已确定的 d 维特征空间划分成决策域的问题。针对不同的对象和不同的目的,可以用不同的模式识别理论或方法,目前基本的技术方法有统计模式识别、句法模式识别。
统计模式识别方法是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还要进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后再进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征,模式可用特征空间中的一个点或一个特征矢量表示。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此引入鉴别函数,由特征矢量计算出相应的各类别的鉴别函数值,通过鉴别函数值的比较实行分类。
统计模式识别方法适用于给定的有限数量样本集,其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征矢量。不同的特征向量,或者说不同类别的对象,都对应于此空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。已知研究对象统计模型或已知判别函数类条件下,根据一定的准则通过学习算法能够把 d 维特征空间划分为 c 个区域,每一个区域与每一类别相对应,模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。统计识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。基于统计模式识别方法有多种方法,通常较为有效,现已形成了完整的体系。尽管方法很多,但从根本上讲,都是直接利用各类的分布特征,即利用各类的概率分布函数、后验概率或隐含地利用上述概念进行分类识别。其中基本的技术为聚类分析、判别类域界面法、统计判决等。
(1)聚类分析
在聚类分析中,利用待分类模式之间的“相似性”进行分类,更相似的作为一类,更不相似的作为另外一类。在分类过程中不断地计算所分划的各类的中心,下一个待分类模式以其与各类中心的距离作为分类的准则。聚类准则的确定,基本上有两种方式。一种是试探方式,即凭直观和经验,针对实际问题定义一种相似性测度的阈值,然后按最近邻规则指定某些模式样本属于某一聚类类别。例如欧氏距离测度,它反映样本间的近邻性,但将一个样本分到两个类别中的一个时,必须规定一距离测度的阈值作为聚类的判别准则,按最近邻规则的简单试探法和最大最小聚类算法就是采用这种方式。另一种是聚类准则函数法,即规定一种准则函数,其函数值与样品的划分有关。当取得极小值时,就认为得到了最佳划分。实际工作中采用最多的聚类方法之一是系统聚类法。它将模式样本按距离准则逐步聚类,类别由多到少,直到满足合适的分类要求为止。
(2)判别类域界面法
判别类域界面法中,用已知类别的训练样本产生判别函数,这相当于学习或训练。根据待分类模式代入判别函数后所得值的正负而确定其类别。判别函数提供了相邻两类判决域的界面,最简单、最实用的判别函数是线性判别函数。利用线性判别函数进行决策就是用一个超平面对特征空间进行分割。超平面的方向由权向量决定,而位置由阈值权的数值确定,超平面把特征空间分割为两个决策区域。
(3)统计判决
在统计判决中,在一些分类识别准则下严格地按照概率统计理论导出各种判决准则,这些判决准则要用到各类的概率密度函数、先验概率或条件概率,即贝叶斯法则。
句法识别是对统计识别方法的补充。统计方法用数值来描述图像的特征,句法方法则用符号来描述图像特征。它模仿了语言学中句法的层次结构,采用分层描述的方法,其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。
句法结构模式识别又称结构方法或语言学方法,主要用于文字识别、遥感图形的识别与分析,以及纹理图像的分析。该方法的特点是识别方便,能够反映模式的结构特征,能够描述模式的性质,对图像畸变的抗干扰能力较强。如何选择机缘是本方法的一个关键问题,尤其是当存在干扰及噪声时,抽取基元更困难,且易失误。把复杂图像分解为单层或多层的简单子图像,主要突出了识别对象的结构信息。图像识别是从统计方法发展起来的,而句法方法扩大了识别的能力,使其不局限于对象物的分类,而且还用于景物的分析和物体结构的识别。
模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法,当被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法。统计方法发展较早,比较成熟,取得了不少应用成果,能考虑干扰、噪声等影响,识别模式基元能力强;但是它对结构复杂的模式抽取特征困难,不能反映模式的结构特征,难以描述模式的性质,对模式本身的结构关系很少利用,难以从整体角度考虑识别问题。而很多识别问题,并不是用简单的分类就能解决的,更重要的是要弄清楚这些模式的结构关系。句法结构模式识别能反映模式的结构特性,识别方便,可从简单的基元开始,由简至繁。描述模式的性质;另一方面,单纯的句法模式识别方法没有考虑到模式所受到的环境、噪声的干扰等不稳定因素的影响,当存在干扰及噪声时,抽取基元困难,且易失误。
在应用中,常常将这两种方法结合起来,分别施加于不同的层次,会收到较好的效果。两者的结合已是模式识别问题的一个研究方向,在这方面,提出了随机文法、属性文法等一些新的研究方向,并取得了一定的成果。