购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 图像的基本概念

1.1.1 图像和图形

图像是对客观世界的反映。“图”是指物体透射光或反射光的分布,“像”是人的视觉对“图”的认识。“图像”是两者的结合。图像既是一种光的分布,又包含人的视觉心理因素。图像的最初取得是通过对物体和背景的“摄取”。这里的“摄取”意味着一种“记录”的过程,如照相、摄影、扫描等,这是图像与图形的主要区别。

图形是用数学规则产生的或具有一定规则的图案。图形往往用一组符号或线条来表示性质,例如房屋设计图,我们用线条来表现房屋的结构。图像和图形在一定条件下可向另一方转化。

1.1.2 什么是数字图像

数字图像又称数码图像或数位图像,是一种以二维数组(矩阵)形式表示的图像。数字图像是由模拟图像数字化得到、以像素为基本元素、可以用数字计算机或数字电路存储和处理的图像。

数字图像可以从许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型。三维几何模型是计算机图形学的一个主要分支,数字图像处理领域主要研究它们的变换算法。

1.1.3 数字图像的特点

数字图像有如下特点:

1)信息量大

以数目较少的电视图像为例,一幅电视图像一般由512×512像素、8bit组成,其总数据量为512×512×8bit=2097152bit=262144B=256KB。这么大的数据量必须由计算机处理,且计算机内存容量要大。

2)占用频率的带宽大

一般语言信息(如电话、传真、电传、电报等)的带宽仅4kHz左右,而图像信息所占用频率的带宽要大3个数量级。例如普通电视的标准带宽是6.5MHz,等于语言带宽的14倍。因此,在摄影、传输、存储、处理、显示等各环节的实现上技术难度大,这使得对频带的压缩技术的要求变得迫切。

3)相关性大

每幅图像中相邻像素之间不独立,具有很大的相关性,有时大片大片的像素间具有相同或接近的灰度。例如电视画面,前后两幅图像的相关系数往往在0.95以上。因此,压缩图像信息的潜力很大。

4)非客观性

图像信息最终的接收器是人的视觉系统。图像信息和视觉系统都十分复杂,与环境条件、视觉特性、情绪、精神状态、知识水平都有关,例如航空照片判读。因此,要求图像系统与视觉系统有良好的“匹配”,必须研究图像的统计规律和视觉特征。

1.1.4 图像单位(像素)

任意一幅数字图像粗看起来似乎是连续的,实际上是不连续的,它由许多密集的色点组成。就像任意物质一样,肉眼看上去是连续的,但实质上都是由分子组成的。这些色点是构成一幅图像的基本单元,被称为像素(或像素点、像元,Pixel)。例如,一幅图片由30万个色点组成,那这幅图片的像素就是30万。像素是数字图像的基本元素。显然,像素越多,画面就越清晰。

像素是感光元件记录光信号的基本单位,通常来说1个像素对应1个光电二极管。我们常说相机是多少像素,这个像素就是说这款相机的感光元件有多少个,有100万个感光元件的相机就是100万像素的相机,有4000万个感光元件的相机就是4000万像素的相机,以此类推。一台100万像素的相机拍摄的照片洗成5寸比洗成6寸清晰一点。像素高并不意味着画质一定好。一款相机的画质是由感光元件尺寸、像素数量、图像处理算法、镜头等共同决定的。同时,画质本身就是分辨率、动态范围、色彩深度、色彩准确性、噪点等诸多指标的集合。像素高低只对分辨率这个单一指标影响较大。

像素是在模拟图像数字化时对连续空间进行离散化得到的。每个像素具有整数行(高)和列(宽)位置坐标,同时每个像素都具有整数灰度值或颜色值。

示例图像及其信息如图1-1和图1-2所示。

图1-1

图1-2

可以看到图1-1的尺寸是500×338,表示图片由一个500×338的像素点矩阵构成,这幅图片的宽度是500像素,高度是338像素,共有500×338像素=149000像素。

又如,屏幕分辨率是1024×768,也就是说设备屏幕的水平方向上有1024个像素点,垂直方向上有768个像素点。像素的大小是没有固定长度的,不同设备上每个单位像素色块的大小是不一样的。例如,尺寸面积大小相同的两块屏幕,分辨率可以是不一样的,分辨率高的屏幕上的像素点(色块)就多,单个色块面积也更小,所以屏幕内显示的画面就更细致。而分辨率低的屏幕上的像素点(色块)较少,单个像素面积更大,显示的画面就没那么细致。

1.1.5 图像分辨率

图像分辨率是指每英寸图像内的像素点数。图像分辨率是有单位的,叫作像素每英寸。分辨率越高,像素点密度越高,图像就越逼真(做大幅喷绘时,要求图片分辨率要高,就是为了保证每英寸的画面上拥有更多的像素点)。

1.1.6 屏幕分辨率

屏幕分辨率是指屏幕在纵横方向上的像素点数,单位为像素(px)。每个屏幕都有其特定的分辨率。屏幕分辨率越高,所呈现的色彩数量和清晰度也就越高。分辨率决定了计算机屏幕上能够显示的信息量,通常用水平和垂直像素的数量来衡量。

在相同大小的屏幕上,较低的分辨率(例如640×480)意味着屏幕上显示的像素较少,单个像素的尺寸较大。而较高的分辨率(例如1600×1200)则意味着屏幕上显示的像素较多,单个像素的尺寸相对较小。这种差异影响了图像的清晰度和细节表现。

1.1.7 图像的灰度

灰度是指将白色与黑色之间按对数关系划分为若干等级的一个概念。通常,灰度分为256个等级,其中0表示黑色。灰度实际上是没有色彩的表现形式,RGB色彩分量在这种情况下全部相等。

例如,在一个二值灰度图像中,像素值只能为0或1,因此其灰度级为2。而对于一个256级灰度的图像,当RGB三个分量相等时,例如RGB(100, 100, 100),则表示灰度值为100;同理,RGB(50, 50, 50)则表示灰度值为50。

一幅图像中不同位置的亮度是不一样的,可用 f ( x , y )来表示点( x , y )上的亮度。由于光是一种能量形式,故亮度是非负有限的(0≤ f ( x , y )<∞)。在图像处理中常用的灰度,其含义是:单色图像中,坐标点( x , y )的亮度称为该点的灰度。设灰度为L,则L min ≤L≤L max ,区间[L min ,L max ]称为灰度范围。

在室内处理图像时,一般L min ≈0.005Lux,L max ≈100Lux,其中Lux是勒克斯(照明单位)。实际使用时,把这个区间规格化为[0,L max ],其中L min =0为黑色,L max 为白色,而所有在白色和黑色之间的值代表连续变化的灰度。图像灰度化处理可以作为图像处理的预处理步骤,为之后的图像分割、图像识别和图像分析等上层操作做准备。

1.1.8 灰度级

灰度级表明图像中不同灰度值的最大数量。灰度级越大,图像的亮度范围就越大。灰度级有时候会与灰度混淆。首先应该明确,灰度(值)是针对单个像素而言的,表示灰度图像单个像素点的亮度值,值越大,像素点就越亮,反之越暗。灰度级表示灰度图像的亮度层次,比如第1级、第2级……第255级等,如图1-3所示。

图1-3

在图1-3中,第0级的灰度是0,第1级的灰度是8,第2级的灰度是16,等等。每个等级对应着一个灰度值。级数越多,图像的亮度范围越大,层次就越丰富。有时,把最大级数称为一幅图像的灰度级数。

1.1.9 图像深度

图像深度是指存储每个像素所用的位数,也用于度量图像的色彩分辨率。图像深度确定彩色图像每个像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。比如一幅单色图像,若每个像素有8位,则最大灰度数目为2的8次方,即256。一幅彩色图像RGB三个分量的像素位数分别为4、4、2,则最大颜色数目为2的4+4+2次方,即1024,也就是说图像深度为10位,每个像素可以是1024种颜色中的一种。

例如,一幅画的尺寸为1024×768像素,深度为16,则它的数据量为1.5MB。计算如下:

1024×768×16bit = (1024×768×16)/8B = [(1024×768×16)/8]/1024KB = {[(1024×768×16)/8]/1024}/1024MB=1.5MB

1.1.10 二值图像

二值图像(Binary Image)是指图像上的每一个像素只有两种可能的取值或灰度等级状态,常用黑白、B&W、单色图像表示二值图像。二值图像一般用来描述字符图像,其优点是占用空间少;缺点是当表示人物、风景的图像时,只能展示其边缘信息,图像内部的纹理特征表现不明显。这时候要使用纹理特征更为丰富的灰度图像。

二值图像中,每个像素只用1bit表示,只有黑白两种颜色。二值图像按名字来理解只有两个值,即0和1,0代表黑,1代表白,或者说0表示背景,而1表示前景。其保存也相对简单,每个像素只需要1bit就可以完整存储信息。如果把每个像素看成随机变量,一共有 N 个像素,那么二值图像有2的 N 次方种变化,8位灰度图有255的 N 次方种变化,8位三通道RGB图像有16777216 N 种变化,注意:16777216=256(红)×256(绿)×256(蓝)。也就是说,同样尺寸的图像,二值图像保存的信息更少。

1.1.11 灰度图

灰度图又称灰阶图,是用灰度表示的图像。除了常见的卫星图像、航空照片外,许多地球物理观测数据也以灰度图表示。我们平时看到的灰度图由0~255个像素组成。

灰度图是二值图像的进化版本,是彩色图像的退化版,也就是灰度图保存的信息比彩色图像少,但比二值图像多。灰度图只包含一个通道的信息,而彩色图通常包含三个通道的信息。单一通道可以理解为单一波长的电磁波,所以红外遥感、X断层成像等单一通道电磁波产生的图像都为灰度图。另外,灰度图在实际应用中具有易于采集和传输等特性,使得基于灰度图开发的算法非常丰富。

灰度图的每个像素只有一个采样颜色,这类图像通常显示为从最暗的黑色到最亮的白色的灰度。灰度图与黑白图像不同,在计算机图像领域,黑白图像只有黑色与白色两种颜色,但是灰度图在黑色与白色之间还有许多级的颜色深度。灰度图经常是在单个电磁波频谱(如可见光)内测量每个像素的亮度得到的,用于显示的灰度图通常用每个采样像素8位的非线性尺度来保存,这样可以有256级灰度(如果用16位,就有65536级)。

1.1.12 彩色图像

彩色图像也就是RGB图像,每个像素通常由红(R)、绿(G)、蓝(B)三个分量来表示,分量值为0~255。我们日常获得的通常是彩色图像,很多时候我们需要将彩色图像转换成灰度图像,也就是将3个通道(RGB)转换成1个通道。

1.1.13 通道

通道把图像分解成一个或多个颜色成分,通常可以分为单通道、三通道和四通道。

● 单通道:一个像素点只需一个数值表示。单通道只能表示灰度,0为黑色。单通道图像就是图像中每个像素点只需用一个数值表示。

● 三通道:把图像分为红、绿、蓝三个通道。三通道可以表示彩色,全0表示黑色。

● 四通道:在RGB的基础上增加了Alpha通道,Alpha通道表示透明度,Alpha=0表示全透明。

1.1.14 图像存储

在计算机中,用 M × N 的矩阵表示一幅尺寸大小为 M × N 的数字图像,矩阵元素的值就是该图像对应位置上的像素值。三通道图像数据在内存中的存储是连续的,每个通道的元素按照矩阵行列顺序进行排列。通常计算机按照RGB方式存储三通道图像格式,而图像采集设备输出图像格式一般是BGR方式。 eS8XgBPhTPzbCGw1THXU09Fj04H0S9tTfV/7BM6B5fGUnYXpdNywT4PLabSGirV/

点击中间区域
呼出菜单
上一章
目录
下一章
×