《空间信息智能处理》

2.1 模式识别的基本概念

2.1.1 模式与模式识别

当人们看到某事物或现象时，首先会收集该事物或现象的所有信息，然后将其行为特征与头脑中已有的相关信息相比较；若找到一个相同或相似的匹配，就可以将该事物或现象识别出来。因此，某事物或现象的相关信息，如空间信息、时间信息等，就构成了它的模式。广义地说，存在于时间和空间中可观察的事物，若可以区别它们是否相同或相似，都可以称之为模式。S. Watanable定义模式为“与混沌相对立，是一个可以命名的模糊定义的实体”。比如，一个模式可以是指纹图像、手写草字、人脸或语言符号等，而将观察目标与已有模式相比较、配准、判断其类属的过程就是模式识别。

模式以及模式识别是和类别（集合）的概念分不开的，只要认识某类事物或现象中的几个，人们就可以识别该类中的许多事物或现象。英文“pattern”来源于法文“patron”，中文翻译为“榜样、模式、样品”，原意是指可作为大家学习的理想人物，或用来模仿复制的完美的样品。在模式识别中，模式是事物的特征，是对事物定量的或结构的描述，例如人的高矮、胖瘦、性别、肤色、年龄、脸型等。模式类是具有某些共同特性的模式的集合。模式识别就是识别出特定事物所模仿的标本，例如人们常常根据高矮、胖瘦、性别、肤色、年龄、脸型等把不同的人区分开来。从不同的角度出发，模式有不同的分类方法，如按事物的性质划分，可分为具体模式和抽象模式。思想、观念、观点、信仰等是抽象的事物，它们属于抽象模式，但这是哲学和心理学研究的范畴。因此，为了强调能从具体的事物或现象中推断出总体，把通过观测具体的个别事物所得到的具有时间和空间分布的信息称为模式，而把模式所属的类别或同一类模式的总体称为模式类。也有人习惯上把模式类称为模式，把个别具体的模式称为样本。在此意义上，人们可以认为把具体样本归类到某一个模式就叫作模式识别或模式分类。人类具有很强的模式识别能力，这是一种基本认知能力或智能，是人类智能的重要组成部分，在各种活动中都有着重要作用，例如通过视觉信息识别文字、图片和周围的环境，通过听觉信息识别与理解语言等。在现实生活中，几乎每个人都会在不经意间轻而易举地完成模式识别的过程。

模式识别研究具体模式的识别，如字符、图画、音乐等，它们通过对感官的刺激而被识别。具体模式主要是视觉模式、听觉模式、触觉模式，另外还有味觉模式、嗅觉模式等。模式识别研究主要集中在两方面，即研究生物体（包括人）如何感知对象，以及研究在给定的任务下，如何用计算机实现模式识别的理论和方法。前者属于认知科学的范畴，是生理学家、心理学家、生物学家的研究内容；后者属于信息科学的范畴，是数学、信息学和计算机科学工作者的研究内容。识别行为可以分为识别具体事物和识别抽象事物两大类。具体事物的识别涉及时空信息的识别：时间信息，例如波形、信号等，空间信息，例如指纹、气象图和照片等。抽象事物的识别涉及某一问题解决办法的识别、一个古老的话题或论点等。换言之，是识别那些不以物质形式存在的现象，属于概念识别研究的范畴。因此，模式识别就是通过计算机用数学方法来研究模式的自动处理和判读。通常要识别的数据有：一维数据，如语音、心电图、地震数据等；二维数据，如文字图片、医学图像、卫星图像等；三维数据，如图像序列、结晶学或X图像断层摄影等。

如前所述，视觉信息和听觉信息是人类赖以实现模式识别的基础，也是模式识别的两个重要方面，代表性产品有光学字符识别、语音识别系统。模式识别的全过程如图2.1所示。模式信息采集是获取被识别对象的特征，如电压、电流等电量，或灰度、色彩、声音、压力、温度等非电量。对于非电量还必须先转化为电量，然后再经模拟-数据（A/D）转换为计算机可以接受的信息。对信息进行预处理是指滤掉样品采集过程中可能引入的干扰信号，人为地突出有用信号，以便获得良好的识别效果。对经过改善的有用信号进行特征或基元抽取，才能正确地分类。抽取准则和方法是模式识别研究的一个重点。特征抽取或基元抽取不是一次就可以完成的，需要不断地修改和完善，图2.1中虚线即表达此意。模式分类是模式识别的关键，它是在前几步准备工作的基础上，将被识别对象进行分类。

图2.1 模式识别的全过程

随着20世纪40年代计算机的出现以及50年代AI的兴起，人们开始用计算机来代替或扩展人类的部分脑力劳动。模式识别在60年代初迅速发展并成为一门新学科。

2.1.2 模式识别方法

随着计算机的飞速发展，模式识别已经成为AI的分支学科。模式识别不仅指感官对事物的感觉，也是人们的一种基本思维活动。根据被识别模式的性质，可以把识别行为分为抽象的和具体的两种形式，具体事物的识别，如对文字、照片、音乐、语言等周围事物的识别；抽象事物的识别，如对已知的一个论点或一个问题的理解，如意识、思想、议论等，属于概念识别研究的范畴。

模式识别又常被称作模式分类，从处理问题的性质和解决问题的方法等角度来看，模式识别分为有监督的分类（supervised classification）和无监督的分类（unsupervised classification）两种。两者的主要差别在于，各实验样本所属的类别是否预先已知。通常说来，有监督的分类往往需要提供大量已知类别的样本，但在实际问题中，这是存在一定困难的，因此研究无监督的分类就变得十分有必要了。根据模式识别的发展和AI的应用，模式识别又可分为统计模式识别、结构模式识别、模糊模式识别和神经网络模式识别四大类。

1.统计模式识别

统计模式识别是发展较早、较成熟的模式统计分类方法，是结合统计概率论的贝叶斯决策系统进行模式识别的技术，又称为决策理论识别；其特点是提取待识别模式的一组统计特征，按某种决策函数进行分类判决。在统计模式识别中，被识别对象首先进行数字化处理，变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示；许多模式识别系统在数字化环节之后还进行预处理，用于除去混入的干扰信息并减少某些变形和失真；随后进行特征抽取，即从数字化或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量，它对于一般的变形和失真保持不变或几乎不变，且只含有尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间，这时模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量，而且易于分类。在决策理论方法中，特征抽取占有重要的地位，但尚无通用的理论指导，只能通过分析具体识别对象来决定选取何种特征。特征抽取后可进行分类，即从特征空间再映射到决策空间；为此引入鉴别函数，即由特征矢量计算出相应于各类别的鉴别函数值，通过对鉴别函数值进行比较实行分类。统计模式识别是比较经典的分类识别方法，在遥感图像模式识别中有着非常广泛的应用。

2.结构模式识别

结构模式识别又称结构方法或语言学方法，其特点是把待识别模式看成由若干个较简单子模式构成的集合。每一个子模式再分为若干个基元，基元按某种组合关系构成模式，就好像文章由字、词、短语和句子按语法规则构成一样，因此又称为句法模式识别。

在结构模式识别中选取基元相当于在统计模式识别中选取特征。通常要求所选的基元既能对模式提供一个紧凑的反映其结构关系的描述，又要易于用非句法模式识别加以抽取。显然，基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述，称为模式描述语句，这相当于在语言中，句子和短语用词组合、词用字符组合一样。基元组合成模式的规则，由所谓语法来指定。一旦基元被鉴别，识别过程可通过句法分析进行，即分析给定的模式语句是否符合指定的语法，满足某类语法的即被分入该类。通常，模式识别方法的选择取决于问题的性质。若被识别的对象极为复杂，且包含丰富的结构信息，通常采用结构模式识别方法；若被识别对象不很复杂或不含明显的结构信息，就采用统计模式识别。这两种方法不能截然分开，在结构模式识别中，基元本身就是用统计模式识别抽取的。在应用中，将这两种方法结合起来分别施加于不同的层次，常常能收到较好的效果。

统计模式识别用数值来描述图像的特征；结构模式识别则是用符号来描述图像特征的，是对统计模式识别的补充。它模仿了语言学中句法的层次结构，采用分层描述的方法，把复杂图像分解为单层或多层的简单子图像，主要突出了识别对象的结构信息。图像识别是从统计方法发展起来的，而结构模式识别方法扩大了识别的能力，使其不仅限于对象物的分类，而且还用于景物的分析与物体结构的识别。结构模式识别主要用于文字识别、遥感图形的识别与分析、纹理图像的分析中。该方法的特点是识别方便，能够反映模式的结构特征，描述模式的性质，对图像畸变的抗干扰能力较强。

3.模糊模式识别

模糊模式识别是模糊集理论（FST）研究中的重要方向。模糊识别的模糊集方法（模糊模式识别）是对传统模式识别方法的统计方法和结构模式识别的有用补充，就是能对模糊事物进行识别和判断，其理论基础是模糊数学。它根据人辨识事物的思维逻辑，吸取人脑的识别特点，将计算机中常用的二值逻辑转向连续逻辑。一般常规识别方法则要求一个对象只能属于某一类别，而模糊模式识别的结果是用被识别对象隶属于某一类别的程度（隶属度）来表示的；一个对象可以在某种程度上属于某一类别，而在另一种程度上属于另一类别。

模糊模式识别就是在模式识别中引入模糊数学方法，用模糊技术来设计机器识别系统，可简化识别系统的结构，更广泛、更深入地模拟人脑的思维过程，从而对客观事物进行更为有效的分类与识别。基于FST的识别方法有最大隶属原则识别法、择近原则识别法和模糊聚类法。伴随着各门学科，尤其是人文、社会学科及其他“软科学”的不断发展，数学化、定量化的趋势也开始在这些领域中显现。模糊模式识别不再简单局限于自然科学的应用，同时也被应用到社会科学，特别是经济管理学方面。

4.神经网络模式识别

人工神经网络（ANN）的研究起源于对生物神经系统的研究。它将若干处理单元（神经元）通过一定的互联模型结成一个网络，这个网络通过一定的机制可以模仿人的神经系统的动作过程，以达到识别分类的目的。ANN是数据挖掘中的一种常用方法，其区别于其他识别方法的最大特点是它不要求对待识别的对象有太多的分析与了解，具有一定的智能化处理的特点。神经网络侧重于模拟和实现人认知过程中的感知过程、形象思维过程、分布式记忆过程、自学习和自组织过程，与符号处理是一种互补的关系。但是，神经网络具有大规模并行、分布式存储和处理能力，以及自组织、自适应和自学习的能力，特别适用于处理需要同时考虑许多因素和条件的不精确或模糊的信息处理问题。

用ANN进行模式识别时，利用神经网络中神经元的记忆能力进行特征信息的存储，通过外接激励修改神经元之间的权值进行特定模式学习，就会形成一个功能强大的神经网络。一般来说，首先用一定量的训练样本对分类器进行训练，然后再利用该分类器对新的识别对象进行识别分类。

模式识别的任务是把模式正确地从特征空间映射到类空间，或者说是在特征空间中实现类的划分。模式识别的难度和模式与特征空间中的分布密切相关，若特征空间中的任意两个类可以用一个超平面去区分，那么模式是线性可分的，这时的识别较为容易。

神经网络对所要处理的对象在样本空间的分布状态无须任何假设，而是直接从数据中学习样本之间的关系，因而可以解决那些因样本分布未知而无法解决的识别问题，并可根据样本间的相似性，对那些与原始训练样本相似的数据进行正确处理。神经网络分类器还兼有模式变换和模式特征提取的作用。神经网络分类器一般对输入模式信息的不完备或特征的缺损不太敏感，它在背景噪声统计特性未知的情况下，性能更好且网络具有更好的推广能力。基于以上种种优点，神经网络模式识别已发展成为模式识别领域的一个重要方法，起到了传统模式识别方法不可替代的作用。