大多数实际应用系统对图像处理的目标是达到实时识别。因此,考察各种计算机识别方法的性能也要从实用角度出发。由于计算机识别技术首先是一种分类技术,作为一个识别系统,要用某些参数来评价其性能的高低。正确识别率这个性能指标是研究识别算法的首要问题。另外,还要考虑计算机识别技术的实时性问题。同时,识别算法所设计的特征库对存储空间的要求,也对该技术的应用有一定的影响。
1)识别率与拒识率
在计算机识别问题中,和识别率相关的概念是正确识别率。若待识别图像属于库中的某一模式,识别系统正确识别出该模式,则这些识别出的图像总数占测试图像总数的百分比为正确识别率。
若待识别图像不属于模板库中的某一模式,而识别系统判断出不属于模板库的图像,则这些图像的总数占测试图像总数的百分比为拒识率。在计算机识别的实际应用中,需要给出拒识,即应设置拒识门限。而在通常的计算机识别方法的研究中,大多数的识别系统都没给出拒识,将拒识门限设为无穷大,即给定一待识别样本,在已知模板库中找到和该样本最相近的样本,而不考虑该样本是否应该是模板库中的已知样本。
这两种情况均为正确识别,识别率由这两部分构成。对一个识别系统,可以用3方面的指标表征系统的性能。
(1)正确识别率:A=正确识别样本数/全部样本数*100%
(2)误识率:S=误识样本数/全部样本数*100%
(3)拒识率:R=拒识样本数/全部样本数*100%
(4)三者的关系是:A+S+R=100%
应用中,人们往往很关心的一个指标是“识别精度”,即在所有识别的样本中,除去拒识样本,正确识别的比例有多大,我们定义识别精度:
P=A/(A+S)*100%
一个理想的系统应是R、S尽量小,而P、A尽可能大。而在一个实际系统中,S、R是相互制约的,拒识率R的提高总伴随着误识率S的下降。与此同时,也伴随着识别率A和识别精度P的提高。因此,在评价识别系统时,必须综合考虑这几个指标。另外,由于识别图像背景和清晰程度可以有相当大的差别。因此,必须弄清所测指标是在怎样的样本集合下获得的。任何识别系统需要从以下两方面改进。一是进一步提高识别率,二是提高实时性。需要对各个环节采用的算法进行进一步的分析、比较和优化。由于计算机识别技术是不断发展的,而各种识别算法的实验条件都有所不同,不同的库和不同的训练样本数。因此,通常情况下不能给出所有计算机识别算法的性能比较。
2)计算时间
由于计算机识别技术的实际应用实时性要求比较强,因此计算时间是计算机识别技术中的一个重要指标。计算时间主要有两方面。一是设计阶段,识别系统训练所需要的时间;另一个是识别阶段,识别系统识别需要的时间。通常情况下,由于识别系统的训练为离线训练。因此,识别系统设计阶段,需要的训练时间可以不考虑。但识别时间却相当重要,它直接影响识别系统的实时性,对识别系统是否可以应用于实践起着决定性作用。
3)数据存储量
在计算机识别系统中,模板库的存储也是个不能不考虑的问题。例如,人脸识别方法需要存储每幅已知的人脸图像,所需存储空间都是很大的。存储大量的模板数据,将会给识别系统造成一定的负担。因此,在开展计算机识别算法研究时,有时也要考虑数据存储量的大小。
4)可扩展性
在计算机识别系统的实际应用中,往往需要不断地对已知模板库进行修改,或删除某些样本,或添加某些样本。因此,对已知模板库的动态维护,维护方法相对简单也是在研究识别技术中要考虑的一个问题。
总之,一个完整的图像识别系统的大体过程为:首先,采集训练样本;然后,根据图像数据特点,选择合适的特征提取方法,达到提取特征的目的;最后,把提取的特征存为特征库。在识别阶段,首先将待测图像进行与训练样本相同的处理,包括相同的预处理过程和相同的特征提取方法。当得到待测图像的特征后,选择合适的模式识别算法,将待测图像的特征与特征库中的训练样本特征进行匹配,最后输出识别结果。进一步从实用角度出发考虑各种计算机识别方法的性能,包括识别率、拒识率、识别精度、计算时间和特征库对存储空间的要求等问题需要对各个环节采用的算法进一步分析、比较和优化,需要对识别系统反复观测。
本书介绍几个在人们的日常生活中常用的图像识别项目开发示例,目的是为读者抛砖引玉,为开发此类项目打下基础。从手写数字识别、邮政编码识别、汽车牌照识别、文字识别、条形码识别,人脸识别、指纹识别和虹膜识别等,这些项目具有重要的应用价值,已经应用到人类社会的各个领域,深深地影响着人类社会的生活。作者多年的研究实践表明,完成一幅图像的识别过程一般要经过许许多多不同的处理过程,图像识别正是这些综合应用的结果。至今没有一个通用的方针来指导这些过程在完成特定任务时应该如何组织和搭配。现有的各种图像识别算法都或多或少地带有一定的局限性。在一种环境下效果很好的算法换一种环境就有可能很糟,一些有一定通用型的效果很好的算法往往计算量很大,难以实时应用。本书实现的系统距离实际应用还有许多改进的空间。研究工作者应该一方面把新的知识运用到图像处理和模式识别中,另一方面应将多种技术方法进行综合使用,努力向着更为成熟、复杂和达到实际应用的方向研究探索。