数字图像处理是指经过空间采样和幅值量化后的图像,它可以利用计算机或其他实时的硬件处理,因而又称为计算机图像处理。
完整的数字图像处理工程大体上可分为图像信息的获取,图像信息的存储,图像信息的传送,数字图像处理,图像信息的输出和显示。
(1)图像信息的获取(Image Information Acquisition)。
就数字图像处理而言,主要是把一幅图像转换成适合输入计算机或数字设备的数字信号,这一过程主要包括摄取图像、光电转换及数字化等几个步骤。
(2)图像信息的存储(Image Information Storage)。
图像信息的特点是数据量巨大。一般进行档案存储,主要采用磁带、磁盘或光盘。为解决海量存储问题,图像处理主要研究数据压缩、图像格式及图像数据库技术等。
(3)图像信息的传送(Image Information Transmission)。
图像信息的传送可分为系统内部传送与远距离传送。内部传送多采用直接存储器访问(Direct Memory Access, DMA)技术以解决速度问题;外部远距离传送主要解决占用带宽问题。目前,已有多种国际压缩标准来解决这一问题,图像通信网正在逐步建立。
(4)数字图像处理(Digital Image Processing)。
概括地说,数字图像处理主要包括如下几项内容:几何处理(Geometrical Processing),算术处理(Arithmetic Processing),图像增强(Image Enhancement),图像复原(Image Restoration),图像重建(Image Reconstruction),图像编码(Image Encoding),图像识别(Image Recognition),图像理解(Image Understanding)。
(5)图像信息的输出和显示。
经过图像信息的获取、图像信息的存储、传送、处理等工作,最后通过相关指令输出处理效果,并通过设备显示出来。
同传统的模拟图像处理相比,数字图像处理有很多优点,主要表现在以下几点。
对于一幅图像而言,不管是2b还是8b图像的处理,对计算机程序来说几乎是一样的。增加图像像素数使处理图像变大,只须改变数组的参数,而处理方法不变。所以从原理上讲,不管处理多高精度的图像都是可能的。而在模拟图像处理中,要想使精度提高一个数量级,就必须对处理装置进行大幅度改进。
不管是什么图像,它们均用数组或数组集合表示,这样计算机容易处理。因此,在传送和复制图像时,只在计算机内部进行处理,这样数据就不会丢失或遭破坏,因此数字图像处理不会因图像的存储、传输或复制等一系列变换操作导致图像质量的退化,从而保持了完好的再现性。而在模拟图像处理过程中,就会因为各种因素干扰而保持图像的再现性。
不管是可视图像还是红外线成像、X射线照片、超声波图像等不可见光成像,尽管这些图像成像体系中的设备规模和精度各不相同,但把图像信号直接进行A/D变换或记录成照片,对于计算机来说都能用二维数组表示,即不管什么样的图像都可用同样的方法进行处理,这就是数字图像处理的通用性。另外,对处理程序加以改变后可进行各种处理,如上下滚动、漫游、拼图、合成、变换、放大、缩小和各种逻辑运算等,所以灵活性很高。
数字图像处理大致包含四个方面的技术内容,分别为图像质量改善、图像分析、图像重建和图像数据压缩。
图像质量改善是力图把图像上的畸变及噪声信息去掉,使图像更清晰,以便准确目视判读和解释图像信息。具体技术措施大致包括以下四类。
(1)锐化技术:是突出图像上的各类边缘处的灰度处理,增大对比度使图像轮廓纹理更清晰。
(2)平滑技术:是一种抑制噪声而达到改善图像质量的措施。
(3)复原技术:是根据引起图像质量下降的原因而采取的一种恢复图像本来面目的处理措施。
(4)校正技术:采取几何校正措施,去掉图像上的几何失真。
图像分析的目的是提取图像中的有用信息,常用技术有:边缘与线条的检测、图像区域分割、形状特征提取与测量、图像纹理分析、图像匹配与融合等。
图像重建是成熟的实用图像处理技术,广泛应用于医学领域中,主要包括CT中投影图像的三维重建,以及应用于测量左、右视图图像,生成立体图像的技术。
图像数据压缩是针对图像经数字化后所产生的图像数据信息量非常大的特点,尤其是彩色动态图像的数据量更是大得惊人,为了对这些图像进行传输和预览,需要减少图像的存储容量。常用的有静态图像的有损压缩和无损压缩技术,如WinZip、WinRar、各种图像格式转换等;也有动态图像的压缩处理技术,如MPEG、网络流媒体技术等。
数字图像处理方法大致可分为两大类,即空域法和变换域法。
1)空域法
这种方法是把图像看作是平面中各个像素组成的集合,然后直接对这个二维函数进行处理。空域法主要有下面两大类。
(1)邻域处理法:其中包括梯度运算、拉普拉斯算子运算、平滑算子运算和卷积运算。
(2)点处理法:灰度处理、面积、周长、体积、重心的运算等。
2)变换域法
数字图像处理的变换域处理方法是首先对图像进行正交变换,得到变换域系数阵列,然后再施行各种处理,处理后再反变换到空间域,得到处理结果。这类处理包括滤波、数据压缩、特征提取等处理。
彩色空间可以理解为彩色的集合,为了有效地表达彩色信息,需要建立和选择合适的彩色表达模型。通常一种彩色可以用3个或4个基本量表示,所以彩色模型是彩色的一种数学抽象。在非正式的情况下彩色空间可以指彩色模型。
RGB代表红、绿、蓝三个通道的颜色,这个标准几乎包括人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。红(R)、绿(G)、蓝(B)三种颜色的强度值均是0~255,则三种光混合在每个像素可以组成16 777 216(256×256×256)种不同的颜色。256级的RGB色彩也被简称为1600万色或千万色,或称为24位色(2的24次方)。
对一种颜色进行编码的方法统称为“颜色空间”或“色域”。简单来说,世界上任何一种颜色的“颜色空间”都可定义成一个固定的数字或变量。RGB(红、绿、蓝)只是众多颜色空间的一种。采用这种编码方法,每种颜色都可用三个变量来表示——红色、绿色以及蓝色的强度。记录及显示彩色图像时,RGB是最常见的一种方案。但是,它缺乏与早期黑白显示系统的良好兼容性。因此,许多电子电器厂商普遍采用的做法是,将RGB转换成YUV颜色空间,以维持兼容,再根据需要换回RGB格式,以便在计算机显示器上显示彩色图形。
CMY是青(Cyan)、洋红或品红(Magenta)和黄(Yellow)三种颜色的简写,是相减混色模式,用这种方法产生的颜色之所以称为相减色,是因为它减少了为视觉系统识别颜色所需要的反射光。
和RGB的区别在于:RGB是红(Red)、绿(Green)和蓝(Blue)三种颜色的简写,是相加混色模式,每种颜色分量越多,得到的颜色越亮,每种颜色的取值范围为0~255;RGB常用于计算机显示方面。
由于彩色墨水和颜料的化学特性,用三种基本色得到的黑色不是纯黑色,因此在印刷术中,常常加一种真正的黑色(Black Ink),这种模型称为CMYK模型,广泛应用于印刷术。每种颜色分量的取值范围为0~100;CMY常用于纸张彩色打印方面。
和RGB的转换公式为:
C=255-R
M=255-G
Y=255-B
该公式证明了从一个涂满纯净青色颜料的表面反射回的光不包含红色(纯净的青色255,则R=0)。同样,纯净的品红色不反射绿色,纯净的黄色不反射蓝色。前述方程同样表明,从255中减去单个CMY值,可以得到RGB值。
HSI是指一个数字图像的模型,它反映了人的视觉系统感知彩色的方式,以色调、饱和度和亮度三种基本特征量来感知颜色。
HSI模型的建立基于两个重要的事实:第一,分量与图像的彩色信息无关;第二,H和S分量与人感受颜色的方式是紧密关联的。这些特点使得HSI模型非常适合彩色特性检测与分析。
(1)颜色模型。RGB图像和与之对应的HSI图像分量关系如图1-10所示。
图1-10 RGB图像和与之对应的HSI图像分量关系
(2)色调H(Hue):与光波的波长有关,它表示人的感官对不同颜色的感受,如红色、绿色、蓝色等,它也可表示一定范围的颜色,如暖色、冷色等。
(3)饱和度S(Saturation):表示颜色的纯度,纯光谱色是完全饱和的,加入白光会稀释饱和度。饱和度越大,颜色看起来就会越鲜艳,反之亦然。
(4)亮度I(Intensity):对应成像亮度和图像灰度,是指颜色的明亮程度。
如果将RGB单位立方体沿主对角线进行投影,可得到六边形,这样,原来沿主对角线的灰色都投影到中心白色点,而红色点(1,0,0)则位于右边的角上,绿色点(0,1,0)位于左上角,蓝色点(0,0,1)则位于左下角。
HSI颜色模型用双六棱锥表示,I是强度轴,色调H的角度范围为[0,2π],其中,纯红色的角度为0,纯绿色的角度为2π/3,纯蓝色的角度为4π/3。饱和度S是颜色空间任一点距I轴的距离。当然,如果用圆表示RGB模型的投影,则HSI色度空间为双圆锥3D表示。
注意: 当强度I=0时,色调H、饱和度S无定义;当S=0时,色调H无定义。
Y是亮度信号(Luminance),即亮度(Brightness);I代表In-phase,色彩从橙色到青色;Q代表Quadrature-phase,色彩从紫色到黄绿色。
相较于其他颜色空间,YIQ颜色空间具有能将图像中的亮度分量分离提取出来的优点,并且YIQ颜色空间与RGB颜色空间之间是线性变换的关系,计算量小,聚类特性也比较好,可以适应光照强度不断变化的场合,因此能够有效地用于彩色图像处理。可用于在自然条件下采集到的复杂背景下的运动目标的识别。
YUV是一种颜色编码方法,常使用在各个视频处理组件中。YUV在对照片或视频编码时,考虑到人类的感知能力,允许降低色度的带宽。
YUV是编译真彩色颜色空间的种类,Y'UV、YUV、YCbCr、YPbPr等专有名词都可以称为YUV,彼此有重叠。“Y”表示明亮度(Luminance、Luma),“U”和“V”则是色度、饱和度(Chrominance、Chroma)。
YCbCr中的Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到图像质量的变化。主要的子采样格式有YCbCr 4∶2∶0、YCbCr 4∶2∶2和YCbCr 4∶4∶4。
4∶2∶0表示每4个像素有4个亮度分量,2个色度分量(YYYYCbCr),仅采样奇数扫描线,是便携式视频设备(MPEG-4)以及电视会议(H.263)最常用格式;4∶2∶2表示每4个像素有4个亮度分量,4个色度分量(YYYYCbCrCbCr),是DVD、数字电视、HDTV以及其他消费类视频设备的最常用格式;4∶4∶4表示全像素点阵(YYYYCbCrCbCrCbCrCbCr),用于高质量视频应用、演播室以及专业视频产品。
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及人类生活和工作方面。随着计算机技术和半导体工业的发展,数字图像处理技术的应用也越来越广泛,总结其他应用大致有以下几个方面。
卫星遥感和航空测量中有大量的图像需要处理,处理有两部分内容:一是图像校正,由于卫星、飞机是空中运动物体,装载的成像传感器受卫星飞机的姿态、运动、时间和气候条件等影响,摄取的图像存在畸变,需要自动校正;二是通过分析、处理遥感图像,有效地进行资源、矿藏勘探,国土规划,灾害调查,农作物估产,气象预报以及军事目标监视等。自从最早美国的喷气推进实验室(JPL)对月球、火星照片进行处理以来,数字图像处理技术在航天、航空中的应用还涉及航天器遥感技术,如很多国家都在利用陆地卫星所获取的图像进行气象监测、资源调查(如森林调查、水资源调查等)、土地测绘、灾害监测(如城市建筑物拆迁、地质结构、水源及环境分析等)、军事侦察等。另外,在航空交通管制以及机场安检视频监控中,图像处理也得到了广泛的应用。
数字图像处理是一种高新技术,一般来说,高新技术总是首先应用于军事国防领域。已经有许多制导武器的核心控制部件都是由数字图像信息处理技术作为核心,这种武器采用被动方式工作,隐蔽性好,抗干扰能力强,智能化程度高,无须人工干预,实现“打了不管”,能在复杂背景中精确地控制导弹命中目标。数字图像处理在军事方面主要用于导弹的精确制导、各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;在公安业务方面主要用于实时监控、安全侦破、指纹识别、人脸识别、虹膜识别以及交通流量监控、事故分析、银行防盗等。
数字图像处理在生物医学领域的应用十分广泛,无论是临床诊断还是病理研究都采用了图像处理技术,而且很有成效。除了最成功的X射线、CT技术之外,还有一类是对医用显微图像的处理分析,即自动细胞分析仪,如红细胞、白细胞分类,染色体分析,癌细胞识别以及超声波图像的分析等。这些技术和设备大大提高了疾病的诊断水平,减轻了病人的痛苦。
数字图像处理技术已经有效地应用于工业生产中的加工、装配、拆卸与质量检查等环节,例如,机械手的手眼系统、车型识别、信函分拣、印制电路板、集成电路芯片掩模版、药片外形、汽车零部件等质量自动检查(逐个检查);又如,在生产线中对生产的产品及部件进行无损检测并对其进行分类,在一些有毒、放射性环境内利用计算机自动识别工件及物体的形状和排列状态等。现已发展到具备视觉、听觉和触觉反馈的智能机器人。高速公路不停车自动收费系统中的车辆和车牌的自动识别就是图像处理技术成功应用的例子。
当前通信的主要发展方向是声音、文字、图像和数据相结合的多媒体通信,也就是将电话、电视和计算机以三网合一的方式在数字通信网上传输。其中,以图像通信最为复杂和困难,因图像的数据量巨大,如传送彩色电视信号的速率达100Mb/s以上,要将这样高速率的数据实时传送出去,必须采用图像处理中的压缩编码技术来达到目的。
在电子商务中,数字图像处理广泛应用于产品防伪、水印技术、利用生物识别实现身份认证和办公自动化等领域。
数字图像处理在文化艺术中的应用包括电影、电视画面的数字编辑,动画的制作,纺织工艺品设计和制作,服装和发型设计,珍贵文物资料的复制和修复,运动员动作分析和评分,数字博物馆,虚拟城市和计算机图形生成技术以及图形变形技术等。