购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1.1 视频的数字化

图像(Image)是一个比较基本的概念,主要是指对客观场景的亮度反映。视频(Video)是对场景连续拍摄的一系列图像,也可称为视频序列(Video Sequences),或简称序列。可见视频是图像中特殊的一类,图像包含视频。因此,很多人,也包括我们,在叙述中涉及“视频”或“图像”的概念时,有时并未刻意加以区分,读者从上下文自然会明白其含义。

出现最早、曾经广泛流行的是模拟摄像机输出的视频信号,不论是PAL制还是NTSC制视频信号,它们都是模拟信号,要想让计算机或数字设备能够处理它们,必须进行数字化。时至今日,尽管直接输出数字视频的数字摄像机已占主流地位,但摄像机内的光电传感元件在本质上输出的还是模拟图像信号,必须要经过数字化过程形成数字视频信号输出,而且更多的是将数字视频信号加以压缩输出。因此,考虑到上述两方面原因,我们认为十分有必要了解视频的数字化原理和过程。

1.从模拟视频到数字视频

图像数字化过程主要包括对连续图像中像素位置的离散化(取样)、对取样点的连续量值的离散化(量化)及对量化后的有限数值进行二进制(或多进制)编码这三个过程。

1)取样

我们知道,模拟视频信号体系的基本特点是用扫描方式把三维视频转换为一维随时间变化的信号。视频信号在时间维( t 维)上把图像分为离散的一帧一帧的图像;在每一帧图像内在垂直方向上( y 维)将图像离散为一条一条的水平扫描行。把图像分成若干帧的过程,实际是在时间方向上进行了取样;把图像分成若干行的过程,实际是在垂直方向上进行了取样。因此,在图像信号数字化的第一步——离散化的过程中,在时间方向和垂直方向上的取样间距往往由模拟电视系统决定,没有可能自由选取。可供人们自由选取的只有水平方向( x 维),在水平方向上可以设置不同的取样间隔(实际上仍然受到摄像机水平分辨率的限制)。图1.1是对视频信号的扫描、取样的示意图。

img

图1.1 视频信号的扫描及取样

2)量化

经过取样的视频,只是在时间和空间上被离散成为像素(样本)的阵列。而每个样本灰度值还是一个有无穷多取值的连续变化量,必须将其转化为有限个离散值,赋予不同码字才能真正成为数字图像,再由计算机或其他数字设备进行处理运算,这种转化称为量化。

量化有两种方式:一种是将样本连续灰度值等间隔分层的均匀量化,另一种是不等间隔分层的非均匀量化。在两个量化级(称为两个判决电平)之间的所有灰度值用一个量化值(称为量化器输出的量化电平)来表示。量化既然是以有限个离散值来近似表示无限多个连续量,就一定会产生误差,这就是所谓的量化误差,由此所产生的失真即量化失真或量化噪声。

当量化层次少到一定程度时,量化值与连续量值之间的差值——量化误差变大,引起显著的图像失真,尤其在原先亮度值缓慢变化的区域会引起生硬的所谓“伪轮廓”。图像量化的基本要求就是在量化噪声对图像质量的影响可忽略的前提下用最少的量化层进行量化。

3)编码

通常对取样值进行等间隔的均匀量化,量化层数 K 取为2的 n 次幂,即 K =2 n 。这样,每个量化区间的量化电平可采用 n 位(比特,bit)自然二进制码表示,形成最通用的PCM(Pulse Coding Modulation)编码。对于均匀量化,由于是等间隔分层,量化分层越多,量化误差越小,但是编码时占用比特数就越多。例如,若采用8比特量化,则图像灰度等级分为2 8 =256层。若输入某一图像样本幅度为120.2,量化后为120,则可用8位二进制码01111000来表示。

4)量化失真

在对取样值进行 n 比特的线性PCM编码时,每个量化分层的间隔(量化步长)的相对值为1/2 n ,假定取样值在它的动态范围内的概率分布是均匀的,则可以证明量化误差的均方值 N q

img

(1.1)

于是,峰值信号功率 S pp (其相对值为1)与量化均方噪声 N q 之比的对数简称为量化信噪比,用分贝(dB)数表示为

img

(1.2)

式(1.2)为表征线性PCM性能的基本公式,取样的编码比特数 n 直接关系到数字化的图像质量,每增减1比特,就使量化信噪比增减约6 dB。可以用主观评价方法选择 n ,比较原图像与量化图像的差别,当量化引起的差别已觉察不出或可以忽略时,所对应的最小量化层比特数即为 n 。目前,对于一般的应用,如电视广播、视频通信等,采用的是8比特量化,已基本能满足要求。但对某些应用,如高质量的静止图像和医学图像和遥感图像处理等,需要10比特或更高精度的图像。

除了以上介绍的均匀量化外,还可以根据实际图像信号的概率分布进行非均匀量化,由此可获得更好的量化效果。通常的做法是把高取样率的PCM编码后的图像作为基本的数字图像,而把在此之上进行的再取样和再量化作为数字图像处理的一部分。例如,从原来较密集的取样经亚取样后成为较稀疏的取样,将原来较细致的均匀量化再进行非线性量化。

2.数字视频的格式

由于目前存在PAL、NTSC等不同的模拟电视制式,在这些制式的基础上经过取样、量化和编码后必然会形成不同制式的数字视频信号,给国际间的数字视频信号的互通带来很大的不便。因此,十分有必要在世界范围内建立统一的数字视频标准。

1)数字视频的BT.601格式

1982年10月,国际无线电咨询委员会(Consultative Committee for International Radio,CCIR)通过了第一个关于演播室彩色电视信号数字编码的建议,即后来的国际电联无线电通信部门(International Telecommunications Union-Radio communications sector,ITU-R)的BT.601数字视频标准,其主要内容如表1.1所示。

BT.601建议采用了对亮度信号和两个色差信号分别编码的分量编码方式,对不同制式的信号采用相同的取样频率——13.5MHz,这是对亮度信号Y的取样频率。由于色差信号的带宽远比亮度信号的带宽窄,因而对色差信号R-Y和B-Y的取样频率较Y减半,为6.75MHz。每个数字有效行分别有720个亮度取样点和360×2个色差信号取样点。对每个分量的取样点都是均匀量化,形成8比特或10比特精度的PCM编码。这几个参数对525行、60场/秒的NTSC制和625行、50场/秒的PAL制视频都是相同的。

表1.1 ITU-R BT.601标准的主要参数(亮度、色差取样格式为4:2:2)

img

2)数字视频的取样点位置

从表1.1中还可以看到,由于色差信号的带宽窄,取样率要比亮度信号低50%,这样做的原因是考虑到人眼对色差信号的分辨率比亮度信号低。按照这种比例取样的数字视频常常又称为4:2:2格式,可以简单理解为图像的每一行里的Y、R-Y、B-Y的样点数之比为4:2:2,这些样点位置的几何分布如图1.2(a)所示。图中的水平虚线表示视频的扫描线,图1.2(b)、(c)、(d)分别给出了4:4:4、4:1:1和4:2:0格式的样点位置示意图。需要说明的是,4:2:0格式虽然不在ITU-R BT.601标准中,但这种格式在实际应用中却相当广泛,为了和其他格式对比,也将4:2:0格式放在这里。图中,“O”表示Y样点位置,“/”表示R-Y样点位置,“\”表示B-Y样点位置。

img

图1.2 不同格式的样点位置示意图 CSzREJIb61/r+rl5Z0R1mR89nn4otg50C+SuYWNWjJ4svgPxu37Is5N0cpavEKnV

点击中间区域
呼出菜单
上一章
目录
下一章
×