购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.4 邮政编码识别

1.研究意义

世界通信技术飞速发展,有线通信与无线通信形式种类众多,然而一般信函的通信联系量还是巨大的,而且随着世界人口的增加和经济活动的发展,人们需要信函通信联系的互换量不断增加。目前,世界上已有40多个国家先后实行了邮政编码制度,每天都有无数的信件在流通。对于成千上万的信件,依靠手工分拣,不仅速度慢,而且会浪费大量的人力和物力。利用机器自动分拣信件,成为了一个非常有前景的课题,并以此作为衡量一个国家通信技术和邮政服务水平的标准之一。

为了实现邮件分拣自动化和邮政网络数字化,我国从20世纪70年代末开始对字符识别进行研究,主要用于邮政信函分拣的数字识别和计算机输入用的英文、数字和符号的识别。目前,我国城市与农村现代化建设的加速,楼宇建筑林立,居民住房分布比较复杂。所以,对于信函上书写或打印的6 位邮政编码的扫描识别,在邮件分拣处理中采用先进的自动分拣系统,准确有效地自动识别信封上的邮政编码,可以提高邮件的分组投递速度,加快邮件传递速度,大大节省时间和人力,提高邮政服务质量。因此,进行这方面的研究有着广泛的社会意义和现实意义。具有较高的可靠性。

随着计算机技术日益飞速的发展,邮政编码识别技术在计算机通信、多媒体计算机系统开发、图像的远程通信、电视会议传输、可视电话、视频管理控制、指纹和唇纹识别等研究项目中得到大量应用。图像处理、模式识别、图像识别等技术还在其他多个领域应用广泛,已经渗透到人们的日常生活中,在机器制造、冶金、地质、农林、渔业、天文气象、医疗、教育、邮政、运输、公安、财会、工矿等部门得到广泛应用,并受到重视,在世界各地的国民经济中发挥越来越大的作用。

2.邮政编码识别系统的构成

信函自动分拣是邮政自动化的一个重要环节,是OCR 技术在实际应用领域的一个成功范例。目前,我国应用的各类信函自动分拣机都是根据信封左上角的6 个红框分割出邮政编码数字的图像。邮政编码识别是针对信封左上角的图像进行处理和识别的,并按照其识别结果控制信函的分拣。信封左上角有6 个红框,因此定位红框所在的位置,即可获取每个数字字符的中心位置、高度、宽度和像素点数等信息,,在此基础上,采用手写数字识别方法对邮编数字0~9自动识别。

一般邮政编码识别系统的构成如下。

(1)获取信封图像。

(2)对信封图像进行预处理。

原始的信封图像通常可能含有噪声点,或图像较淡,很多图像还是倾斜的。为提高系统的性能,必须经过预处理才可解决这些问题。对于单张信封的黑白扫描图像来说,预处理的主要内容包括灰度化、二值化、图像平滑、除去噪声和倾斜校正。

(3)进行版面分析,得到的邮政编码区域。

版面分析主要是对信封图像进行版面分割和版面理解,根据图像的一些特征把其分割成版面的一些基元,并根据版面的信息和先验知识来初步判断整个版面基元的信息。包括邮编框的检测、定位和分离。

(4)从邮编框中提取单个数字图像区域。

邮政编码的提取又分为两个过程:单个数字图像的定位和提取。整个过程采用根据邮编框的包络位置,自顶向下和自底向上相结合的方案,确定6个邮政编码数字的位置,从邮政编码图像块中提取单个数字图像。

(5)进行字符分割。

对提取的单个数字图像根进行二值化处理、噪声滤波处理、膨胀处理,利用水平投影与垂直投影技术,对数字精确分割。

(6)进行手写数字特征选择与提取,构建样本特征库。

(7)进行手写数字模式识别。

分析模板匹配分类器、神经网络算法和基于多分类器组合的邮政编码识别。特征提取和邮政编码识别可以参考手写数字识别的过程。

3.识别难点

邮政编码识别是模式识别学科的一个传统研究领域,涉及图像处理、模式识别和图像识别等相关技术。信函分拣系统涉及OCR技术几乎所有方面,包括图像预处理、版面分析、文本提取、手写数字识别、汉字识别、字符分割、后处理等,是一个非常复杂的系统工程。信件自动分拣的基础是对信封左上角邮编框内手写邮编数字0~9的自动识别。邮政编码自动识别是实现信函自动分拣的核心,是实现邮政通信自动化与机械化的关键。

(1)对于大多数信封图像来说,一般比较规则,分为邮政编码块、收信人姓名地址块、寄信人姓名地址邮政编码块。有些信封的邮戳、图像和不规则的手写,给版面分析增加了难度。

(2)剔除方框时分为以下几种情况:对于数字写得比较规范的、在方框里的情况;数字与方框有粘连的情况;数字写出方框外的情况。这些情况都要分别处理。

(3)邮政编码数字大部分为手写阿拉伯数字,阿拉伯数字是通用的国际符号,且经常涉及金融和财务等众多领域。因此,提高识别的准确率,降低误识率和拒识率具有非常重要的意义。对于识别无限制的手写数字或者字符能够达到非常高的识别精度与识别率,是目前识别技术发展的重要课题,同时也对研究者提出巨大的挑战。 BIWpqRdgP77ENDnc09LOMYRO4k06JafVZaH9A106uBkTE4TcCgxbSPLvvVM3C8zz

点击中间区域
呼出菜单
上一章
目录
下一章
×