图像识别与项目实践——VC++、MATLAB技术实现最新章节_杨淑莹著

2.1　图像识别开发基本流程

图像识别的过程主要包括数据特征分析、图像预处理、特征提取、模式识别4个主要过程。图像识别处理的基本流程如图2-1所示。

图2-1　图像识别处理的基本流程

1）数据特征分析

不同的问题需要不同的处理手段。针对图像识别问题，在实际应用中，图像数据来源于不同的环境，提取的目标也大不相同，因而处理方法也不同，就需要对采集来的图像数据进行分析。找出去掉背景和突出目标的方法。因而无论什么问题，都需要尊重客观现实，具体问题具体分析。

首先需要对图像数据分析，要清楚地知道想要得到图像中的哪些目标数据。通过对数据源和目标数据的分析，然后决定采用哪些可行的手段进行预处理。以汉字识别为例，我们拿到的是一幅含有噪声的汉字图像，目标是提取出图像中的汉字信息，并对汉字进行识别。此时，通过对目标数据的分析，就可以开始对图像进行预处理。第一步要去除图像的背景，这里主要是使用灰度化和二值化的方法，背景去除后，图像上可能依旧残留一些孤立的噪声，这时需要用一些去噪的方法先将这些噪声去除。图像处理干净后，进行第二步。第二步，将重点放在汉字定位上，此时就要考虑用什么方法能够对汉字进行精准的定位，只有定位准确了，才能更好地提取汉字特征，识别出这些汉字。

2）图像预处理

图像预处理是图像识别的重要组成部分，是对输入的图像进行特征抽取、分割及识别前所进行的操作。目的是消除图像中的无关信息，提取有用的信息，最大限度地简化需要的数据，从而增加特征抽取、图像分割和识别等后续处理步骤的可靠性。

从实际应用角度出发，采集的图像必然含有大量的背景噪声，还要受到光照的影响、运动造成的物体模糊等现象，由此，需要先进的图像预处理技术解决现实问题。在图像预处理过程中，不可能用某一种技术解决上述问题，往往需要一系列的处理过程，如灰度变换、几何校正、去噪和边缘检测等过程综合应用，将图像中感兴趣的物体突出，衰减其不需要的背景。预处理后的输出图像并不需要去逼近原图像。

图像预处理技术就是在对图像进行正式处理前所做的一系列操作，因为图像在传输过程和存储过程中难免会受到某种程度的破坏和各种各样的噪声污染，导致图像丧失了本质或者偏离了人们的需求，而这就需要一系列的预处理操作来消除图像受到的影响。

3）特征提取

特征提取的目的是从图像中提取出有利于识别目标物体的属性特征，如物体的颜色信息、物体的纹理信息、几何形状信息和空间关系信息等，为识别打下基础。特征提取的结果直接影响识别的精度。

4）模式识别

模式识别是指对表征事物或现象的各种形式的（数值的、文字的和逻辑关系的）信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类，从处理问题的性质和解决问题的方法等角度考虑，分为有监督学习和无监督学习两种方法。二者的主要差别在于，各实验样本所属的类别是否预先已知。一般来说，有监督的分类往往需要提供大量已知类别的样本。

一个完整的监督图像识别系统的大体过程为：首先，采集训练样本；然后，根据图像数据特点，选择合适的特征提取方法，达到提取特征的目的；最后，把提取的特征存为特征库。在识别阶段，首先将待测图像进行与训练样本相同的处理，包括相同的预处理过程和相同的特征提取方法。当得到待测图像的特征后，选择合适的模式识别算法，将待测图像的特征与特征库中的训练样本特征进行匹配，最后输出识别结果。

模式识别研究主要集中在两方面。一是研究生物体（包括人）是如何感知对象的，属于认识科学的范畴；二是在给定的任务下，如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家和生物学生理学家的研究内容；后者通过数学家、信息学专家和计算机科学多年来的努力，已经取得了系统的研究成果。应用计算机对一组事件或过程进行辨识和分类，所识别的事件或过程可以是文字、声音和图像等具体对象，也可以是状态和程度等抽象对象。这些对象与数字形式的信息相区别，称为模式信息。模式识别所分类的类别数目由特定的识别问题决定。有时，开始时无法得知实际的类别数，需要识别系统反复观测被识别对象以后确定。

2.1 图像识别开发基本流程

2.1　图像识别开发基本流程