购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3 手写数字识别

1.研究意义

数字是人们日常生活进行信息交流中的不可缺少的重要工具之一,人们经常运用的数据都是阿拉伯数字。随着社会的发展,各国的经济交流日益加深,人们每天要处理大量的票据,都要与大量数据打交道。手写数字识别应用在邮政编码、财务报表和银行票据等方面。

1)手写数字识别在邮件分拣中的应用

随着我们生活水平的提高和经济活动的发展,通信联系的需求使信函的互换量大幅度增加,我国函件业务量也在不断增长,一些大城市的中心邮局每天的处理量高达几百万件。业务量的急剧上升使得邮件的分拣自动化成为大势所趋。

2)手写数字识别在财务、税务和金融领域中的应用

财务、税务和金融是手写数字识别大有可为的又一领域。随着我国经济的迅速发展,每天等待处理的财务、税务报表、支票和付款单等越来越多。如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力。

3)手写数字识别在大规模数据统计中的应用

在行业年检和人口普查等需要处理大量字符信息录入的场合有很大的实用价值。这些行业往往需要对手写数字进行大量录入操作,手写数字识别的研究对优化业务流程和提高工作效率有巨大的推动作用。近年来,在这类工作中采用OCR技术已成为一种趋势。

手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值。

(1)阿拉伯数字是唯一的被世界各国通用的符号,为各国和各地区的研究工作者提供了一个施展才智的大舞台。对手写数字识别的研究基本上与文化背景无关,在这一领域大家可以探讨和比较各种研究方法。

(2)由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明显的例子就是人工神经网络算法以手写数字识别作为具体的实验平台,验证理论的有效性和评价各种方法的优缺点。

(3)尽管人们对手写数字识别技术已从事了很长时间的研究,并已取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的问题。

(4)手写数字识别方法很容易推广到其他一些相关问题,一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。

2.手写数字识别系统的构成

手写数字识别的研究对象就是利用计算机系统智能地和准确地识别出手写数字。手写数字识别是图像识别学科下的一个分支,它是图像处理和模式识别领域研究的课题之一,由于其具有很强的实用性,一直是多年来的研究热点。手写数字识别是光学字符识别技术的一个重要分支,包括两类。一类为联机手写数字识别,另一类为脱机手写数字识别。在整个O C R领域中,最为困难的就是脱机手写数字识别。目前,脱机手写数字识别的研究已经取得了较大的进展,有相对完善的识别技术与流程。

脱机手写数字识别系统的构成如下。

1)获取数字图像

手写数字识别时,首先将印(写)在纸上的字符,经光电扫描产生模拟电信号,再通过模数转换把带灰度值的数字信号输入计算机中,再通过所建立的模式识别系统,自动识别出所对应的数字。在此过程中,纸张厚度、洁白度、光洁度、油墨深浅、印刷或书写质量都会造成字形畸变、产生污点、飞白、断笔、交连等干扰。输入设备的鉴别率、线形度、光学畸变、量化过程也要产生噪声。

2)数字图像预处理

在单个字符识别之前,要对带有随机噪声的字符灰度值数字信号进行预处理。对手写数字进行必要的预处理,包括去噪、二值化、细化、图像倾斜校正、图像归一化、提取数字的外界矩形框等操作,将图像带来的外界干扰物排除,得到清晰的图像,这样能够更好地进行手写数字识别操作,所以图像预处理至关重要,直接影响数字识别效果。

3)数字特征提取

提高手写数字识别率的重要方法是提取数字的可靠特征,手写数字特征的提取和选择是决定识别率的关键。当特征值过少时,由于决定性的分类特征太少,使得分类器无法发挥学习分类的功能,造成系统无法辨识。当特征值过多时,除了使系统存储量变大之外,也会因特征值的某些部分与其他特征值冲突,从而造成系统辨识的误差。

4)数字进行识别

采用模式识别技术,设计对应的识别算法,达到识别的目的。

3.识别难点

数字的类别只有10 种,笔画又简单,其识别问题表面上是一个较简单的分类问题。但实际上,由于不同的人所写的数字体形态各异,千差万别,手写数字随意性大,书写不规范,经常出现连笔和断笔等现象,甚至同一个人写出的数字也不一定相同。所以,手写数字识别是极其复杂的。而在实际的应用系统中,对数字识别单字识别正确率的要求要比文字苛刻得多,这是因为数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及财会和金融领域,特别是有关金额的数字识别时,如支票中填写的金额部分,其严格性更是不言而喻的。因此,用户的要求不是单纯的高正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。

阿拉伯数字只包括10种符号,笔画书写也不复杂,但它的识别难度较大。造成其识别困难的若干原因如下。

(1)笔画简单,某些数字的字形相差不大,使得这些手写数字的识别变得相当困难。

(2)书写随意,单个数字的变化可能很大。

(3)数字之间没有语义相关性,要通过后续处理进行识别结果纠正的可能性很低。

到目前为止,尽管人们在脱机手写英文和汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。因此,研究高性能的手写数字识别算法是一个有相当挑战性的任务。随着信息化的发展,实现计算机手写数字识别是加快社会信息化进程的关键所在。手写数字识别的应用需求将会更加广泛。一旦研究成功并投入应用,将产生巨大的社会和经济效益,有着重大的现实意义。 1YJ9O20x1cuWnisXYL0EZqloxYBkmwX0H4rEAqABFFTk6+siF6Tjnr9Y7PGahfnx

点击中间区域
呼出菜单
上一章
目录
下一章
×