教学目标
通过本模块的学习,学生能掌握数字电视信号的产生过程:取样、量化和编码。理解电视信号数字化过程,掌握数字电视信号的样值结构。掌握亮度信号与色差信号的时分复用、数字电视信号的行场定时关系、辅助信号与音频信号的插入方式、演播室标准串行数字信号的传输接口。了解标准清晰度电视、高清晰度电视及超高清晰度电视演播室数字分量的相关国家标准。
教学重点
1.数字电视信号的产生过程:取样、量化和编码。
2.数字电视信号的样值结构。
3.亮度信号与色差信号的时分复用、数字电视信号的行场定时关系。
4.演播室标准串行数字信号的传输接口。
教学难点
1.数字电视信号的样值结构。
2.数字电视信号的行场定时关系。
3.数字视频信号与模拟信号波形的定时关系。
4.演播室标准串行数字信号的传输接口。
电视伴音信号是电视信号的重要组成部分。由于人的听觉比视觉更为敏感,所以电视伴音质量的水平,对受众的观看感受影响非常大。音频信号的数字化是电视信号数字化的重要环节。
对音频信号的分析表明,音频信号由许多不同频率和幅度的信号组成,这类信号通常称为复合信号。现实的音频信号一般都是复合信号,只有在对音频系统进行测试时,才人为地使用单一频率、恒定幅度的信号。音频信号的另一个重要参数就是带宽,用来描述组成复合信号的频率范围。如高保真音频信号(High Fidelity Audio)的频率范围是10Hz~20kHz,此时的带宽约为20kHz。
1.每秒钟采集多少个音频样本值,也就是采样频率 f s 是多少。
2.每个音频样本的量化位数应该是多少,这决定了样本的量化精度。
采样又称抽样或取样,它是把时间上连续的模拟信号变成时间上离散的样值信号;量化则是将任意幅度的样值转为幅度离散的、幅度取值有限的样值信号。采样频率由奈奎斯特采样定理给出,采样频率应该大于原始模拟信号最高频率的两倍以上,即: f s ≥2 f m ,其中 f s 是取样频率, f m 是被取样信号的最高频率。考虑到实际滤波器的过渡特性,一般取 f s =2.1 f m ~2.5 f m 。
每个样本的量化比特数,反映出或者说决定了音频波形幅度的量化精度。比如,当每个音频样本用16位二进制数表示时,可能的音频样本值处在0~65 535的范围里,量化的精度就是最大输入信号的1/65 536,或者说,对音频波形量化取值的误差不超过1/(65 536×2)。
数字音频的音质随着采样频率及所使用的量化比特数的不同而呈现较大的差异。人耳的听觉特点是能感觉极微小的声音失真,同时又能适应相当大的动态范围。由于听觉的这个特点,对音频信号进行数字化所需要的量化比特数要比视频信号多。
人耳听觉的频率上限在20kHz左右,为了保证声音不失真,采样频率通常应大于40kHz。广播电视行业主要采用三种取样频率:
1.32kHz:这种取样频率用于早期调频立体声广播发射机的信号源。
2.44.1kHz:早先比较成熟的磁带录像技术记录数字音频信号时使用这一频率。数字音频信号数据须纳入电视的行、场格式中。有关标准规定,对于625行/50场标准的录像机,利用每场312.5行中的294行记录数字音频信号,并规定每行记录三个样值,因此取样频率为50×294×3=44 100Hz。后来这类录像机用来做CD的复制源,44.1kHz开始成为事实上的标准。
3.48kHz:此频率与32kHz有简单的换算关系,便于进行标准间的转换。
不难想象,量化比特数越多,量化精度越高(误差越小),但生成的数码率也越大。数学计算证明了这一点。对于声音这样的双极性信号,在均匀量化、仅考虑量化误差(亦称量化噪声)引入噪声的情况下,信噪比计算公式如下:
S / N ≈6.02 n +1.76+20lg( u / u M )(dB)
其中 n 指的是量化的比特数, u 指的是输入信号的幅度, u M 指的是允许输入信号的最大值。由上式可见量化比特数每增加1比特,信噪比可提高6dB。量化比特数数值越大,信噪比越高,数码率也越大,传输所使用的带宽也越大。
在部分数字电视摄像机中,音频的量化比特数可以根据需要选择16或24。这时的量化比特数相对够多,对于电视伴音的数字化,采用均匀量化已经可以满足信噪比要求。
反映音频数字化质量的另一个因素是声道数。声道数越多,受众的听觉现场感越强。但随着声道数的增多,在音频的采集和制作环节,工作量会成倍地增加。除上述因素之外,数字化音频的质量还会受到麦克风和扬声器的质量、模数与数模转换器的品质、各设备之间连接电缆屏蔽效果等因素的影响。
声音信号数码率 R b (信息传输速率)由抽样频率、量化比特数和声道数决定:
R b = f s × n ×声道数(bit/s)
R B =( f s × n ×声道数)/8(Byte/s)
R B 是用字节数表示的数码率,每字节为8个比特。
虽然都是通过取样、量化、编码的步骤进行数字化,但与音频信号相比,视频信号的数字化要复杂得多,主要体现在取样频率的选择以及量化方式和量化比特数的选取上。
彩色电视信号的数字化,有复合编码和分量编码两种编码方式。复合编码是将彩色全电视信号直接编码成PCM形式。分量编码是将亮度信号和两个色差信号(或三个基色信号)分别编码成PCM形式。
复合编码的优点是传输数码率低,设备较为简单,适用于在模拟系统中插入单个数字设备的情况。缺点是由于采样频率必须与彩色副载频保持一定的比例关系以减轻色彩失真,而不同电视制式的副载频往往各不相同,难以统一;再就是采用复合编码时,采样频率和副载频之间的差拍造成的干扰会影响图像(特别是色彩)的质量,故电视信号数字化一般不采用复合编码方式。
与复合编码相比,分量编码几乎与电视制式无关,大大方便了不同电视制式节目间的交换。分量编码在节目后期制作、信号处理等方面都有着复合编码无可比拟的优势。分量编码对亮度和色度信号分别处理,不会造成亮、色串扰。
由于分量编码的上述优点,国际无线电咨询委员会(CCIR)在1982年2月的第15次全会上通过了以分量编码作为电视演播室数字编码的国际标准。
根据取样定理,从时间上离散的信号中可以完全恢复出原来的模拟信号,即取样过程不会造成模拟信息的损失,工程上有时称之为无损取样。
对于彩色视频信号而言,既要考虑亮度信号,又要考虑色差信号。亮度信号的频带宽度较宽,625行的PAL制为5.5~6.0MHz,525行的NTSC制为4.2~5.5MHz。若以6MHz的2.2倍上限频率计算,则取样频率 f s 应选择13.2MHz。但是取样频率的选择还需要考虑采样点的空间结构,使采样点在相邻行之间上下对齐,有规则地进行排布,这样对于后续的码率压缩处理具有很大的方便性。我们知道,PAL制的行频是15 625Hz,NTSC制的行频约为15 734.266Hz,它们的最小公倍数是2.25MHz。而13.5MHz是离13.2MHz最近的2.25MHz的整数倍,所以将标清视频信号的视频采样频率定为13.5MHz。这样,对于PAL制,亮度信号每行的取样点数为864个;对于NTSC制,每行的取样点数为858个。因为人眼对于色度信号相对不敏感,模拟视频信号中的色度信号采用了“大面积着色”方式,色度信号的频率上限大约在3MHz以下。所以,在满足观看效果的前提下,色差信号的取样频率选为亮度信号取样频率的一半,即6.75MHz。这样,对于PAL制,两个色差信号每行取样点数分别为432个;对于NTSC制,两个色差信号每行取样点数分别为429个。为方便不同电视制式之间的节目转换,并考虑到同步、消隐等信号的安排,统一规定每个数字有效行的亮度信号取样点数为720个,两个色差信号的每个数字有效行的取样点数分别为360个。
量化是在幅度轴上把具有连续值的模拟信号取样值变为离散值。模拟信号通过取样过程,在时间轴上已变为一个个离散的样值脉冲,但在幅度轴上仍是模拟信号的任意量值,所以还必须进一步用有限个电平等级来尽量逼近实际量值。
人眼能适应的亮度信号动态范围是非常大的,远超现有最好的摄像机所能摄取的亮度信号的动态范围。但人从视觉心理上更多地关注景物亮度的对比度,只要从视频显示装置上复原的景物亮度的对比度与原场景中的对比度一致,就不会有失真感。因此,为了能够更好地处理视频信号,在光线进入感光器件之前,需要通过镜头的光圈、摄像机的快门(电子、机械)、中性滤色片等部件对光的强度进行调整,但维持景物原有的对比度,以适应感光器件的动态工作范围。在感光器件完成光电转换后,还需要对电信号进行一些抑制高亮度部分的处理(拐点调整电路,其实是限幅电路),才可以进行视频信号的量化。处理后的视频信号采用均匀量化方式。量化比特数选取8比特或者10比特,现在的摄录像机一般取10比特(超高清电视也有取12比特的),这样采用4∶2∶2取样标清视频的码率为:
13.5MHz×10bit+6.75MHz×10bit×2=270Mbit/s
在10bit量化系统中共有1024个数字电平(2 10 个),用十进制数表示时,其数值范围为0~1023;用十六进制表示时,其数值范围为000~3FF。数字电平000~003和3FC~3FF为储备电平或保护电平,这两部分电平数值是不允许出现在数据流中的,因为这些数值要留作他用,比如000和3FF就用于传送同步数据。
从004到3FB即十进制数的4到1019代表亮度信号电平;消隐电平定为040(十进制数64);峰值白电平定为3AC(十进制数940)。
有关标准规定数字电平留有很小的余量,底部电平余量为004~040(十进制表示为4~64),顶部电平余量为3AC~3FB(十进制表示为940~1019),也就是说,这是标准中容许的黑电平和白电平“过冲”。数字分量方式对亮度信号中的同步信号部分不进行取样操作。
色差信号的电平是双极性的,而A/D转换器需要单极性信号。具体的处理方法是将色差信号的电平上移350mV。色差信号的消隐电平(即零电平)定为200(十进制数512),最高色差电平定为3C0(十进制数960),最低色差电平定为040(十进制数64)。
量化后的亮度信号 Y 和两个色差信号 R - Y = C R 、 B - Y = C B (或3个基色信号 R 、 G 、 B 分量)分别编码成PCM形式。
亮度信号 Y 、红色差 R - Y 和蓝色差 B - Y 信号的码电平分配如图2-1所示(图中信号电平进行了归一化处理)。
图2-1 视频分量信号的码电平分配示意图
为了便于信号处理,有关标准规定了亮度信号和色差信号的正交取样结构。对于4∶2∶2分量编码的取样结构,规定每一行中两个色差信号的样点空间同位,而色差信号与亮度信号的奇数样点空间同位,如图2-2所示。所谓4∶2∶2,就是说每产生4个亮度样点,就有对应的2个红色差样点和2个蓝色差样点。
图2-2 4∶2∶2分量编码取样结构
对于4∶4∶4分量编码的取样结构,规定每一行中两个色差信号的样点空间同位,而色差信号与亮度信号的样点空间同位。4∶4∶4分量编码,还有一种编码方式是直接对 R 、 G 、 B 三个单色信号进行编码,如图2-3所示。所谓4∶4∶4,就是说每产生4个亮度样点,就有对应的4个红色差样点和4个蓝色差样点,或者指三基色样点一样多。
图2-3 4∶4∶4分量编码取样结构
对于4∶1∶1分量编码的取样结构,规定每一行中两个色差信号的样点空间同位,而色差信号与亮度信号隔三个样点空间同位,如图2-4所示。所谓4∶1∶1,就是说每产生4个亮度样点,只有对应的1个红色差样点和1个蓝色差样点。
图2-4 4∶1∶1分量编码取样结构
对于4∶2∶0分量编码的取样结构,规定奇数行中只有 R - Y 色差信号取样点,没有 B - Y 色差信号取样点,且 R - Y 色差信号与亮度信号的奇数样点空间同位;偶数行中只有 B - Y 色差信号取样点,没有 R - Y 色差信号取样点,且 B - Y 色差信号与亮度信号的奇数样点空间同位,如图2-5所示。所谓4∶2∶0,是说每产生4个亮度样点,只有对应的2个红色差样点,没有蓝色差样点(奇数行),或是只有对应的2个蓝色差样点,没有红色差样点(偶数行)。
图2-5 4∶2∶0分量编码取样结构
在标准清晰度数字电视当中,4∶1∶1与4∶2∶0这两种取样方式,并不是演播室视频采样的标准方式。4∶1∶1主要用在DV录像机当中,4∶2∶0主要用在DVCAM录像机当中。这就是说,4∶2∶2是一种比较规则的取样结构。但不难理解,通过对样值的处理,不同的取样结构可以实现相互转换。
由于样点位置在垂直方向上逐行、逐场对齐,即排成一列列直线,故形成正交取样结构, C B 和 C R 样点位置与 Y 的奇数位样点位置一致。
图2-6表示的是625行/50场制的数字有效行及其与模拟有效行之间的对应关系。图中0 H 与行同步脉冲前沿的半幅值点一致,对应于一行中第一个取样时刻,第133~852个样点组成数字有效行,它比模拟有效行前面多10个样点,后面多8个样点,这18个样点的额定保留期可用来在D/A变换时形成具有标准前后沿的消隐脉冲。
图2-6 625/50数字有效行及其与模拟有效行对应关系
在每一行中的总样点数等于取样频率 f S 与行频之比 f S / f H 。对于525/60扫描标准,每行内 Y 样点数为858个,编号为0~857;每行的色差信号样点数是429个,编号为0~428。对于625/50扫描标准,每行的 Y 样点数是864个,编号为0~863;色差信号的样点数为432个,编号为0~431。
根据规定,两种扫描标准的数字有效行样点数是相同的,亮度有效行的样点数是720个,编号为0~719; C B 和 C R 有效行样点数都是360个,编号为0~359。
两种扫描标准的数字行消隐期是不同的,且小于模拟行消隐持续期。对于525/60扫描标准,行消隐持续138个取样周期,为第720~857周期。对于625/50扫描标准,行消隐持续144个取样周期,为第720~863周期。
图2-7 625/50标准的4∶2∶2样点位置与行同步之间的关系
数字有效行持续时间为:720×1/13.5MHz=53.333μs,其中第0~9个样点持续时间为10×1/13.5MHz=0.74μs,在D/A变换时用来形成模拟行消隐的上升沿(后沿);最后的第712~719个样点持续时间为8×1/13.5MHz=0.59μs,用于形成模拟行消隐的下降沿(前沿)。数字有效行内的第10~711个样点持续时间为702×1/135MHz=52μs,这正是持续传送图像内容的模拟有效行持续期,参看图2-7。
对于525/60扫描标准,4∶2∶2视频样点位置与行同步之间的关系可参看有关标准。对于625/50扫描标准,4∶2∶2视频样点位置与行同步之间的关系如图2-7所示。两种扫描标准的数字有效行有相同的样点数,它们每一行内样点数的差别都留到数字行消隐期间了,525/60标准的数字行消隐持续138个样点间隔;625/50标准的数字行消隐持续144个样点间隔。
在模拟信号中采用隔行扫描方式,不论是每帧525行还是每帧625行,在分成上下两个半场时,都会遇到出现半行的情况。为了避免处理半行数字信号,视频数字场与模拟场的场消隐不同,图2-8表示了525/60标准的4∶2∶2数字场与模拟场之间的关系。数字场的安排是:第1场的行数为262,第2场的行数为263,两场的固定场消隐都是9行。应该注意:在数字场消隐后边的一些行作为可选消隐行,当作为有效行使用时,V=0;作为消隐行使用时,V=1。
图2-8 525/60标准的4∶2∶2数字场与模拟场之间的关系
图2-9表示了625/50标准的4∶2∶2数字场与模拟场之间的关系。同样为了避免处理半个数字行,将两场的有效行数都定为288行,第1场的场消隐期为有效行前的24行,第2场的场消隐期为有效行前的25行。
图2-9 625/50标准的4∶2∶2数字场与模拟场之间的关系
在1982年2月CCIR第15次全会上通过的CCIR 601建议(后来做了一些修改和补充,现改称为ITU-R BT.601),考虑到现有的多种彩色电视制式,提出了一种全世界范围内兼容的数字编码方式,确定了以分量编码4∶2∶2标准作为演播室彩色电视信号数字编码的国际标准。该建议是全世界范围内数字电视系统参数统一化、标准化迈出的第一步。该建议对彩色电视信号的编码方式、采样频率及采样结构都做了明确的规定,见表2-1。以亮度信号的采样频率13.5MHz除以行频,可得出625/50和525/60制式中每行的亮度采样点数分别是864和858,规定其行正程的采样点数均为720,则其行逆程的采样点数分别为144和138。由于人眼对色差信号的敏感度要低于对亮度信号的敏感度,为了降低数字电视信号的总数码率,在分量编码时可对两个色差信号进行亚采样,再考虑到采样的样点结构满足正交结构的要求,ITU-R BT.601建议两个色差信号的采样频率均为亮度信号采样频率的一半,即6.75MHz,相应的每一行的样点数也是亮度信号样点数的一半。简而言之,对演播室数字电视设备进行分量编码的规定是:亮度信号的采样频率为13.5MHz,两个色差信号的采样频率为6.75MHz,其采样频率之比为4∶2∶2,所以称为4∶2∶2格式。用于对视频信号源进行信号处理的质量要求更高的设备,也可以采用4∶4∶4的采样格式。同时还有运用比较多的4∶2∶0采样格式,它的亮度信号采样频率为13.5MHz,每帧的亮度包含720×576的样本值,每帧的色差信号 C B 、 C R 包含360×288个样本值,即每隔一行对两个色差信号分别采样一次,每采样行中每隔一个像素对色差信号采样一次。为满足电视会议和可视电话的需要,还产生了CIF(352×288,30帧/秒)和QCIF(176×144,30帧/秒)格式等。
表2-1 ITU-R BT.601建议的主要参数(采样格式为4∶2∶2)
彩色电视信号采用分量编码方式,对亮度信号和两个色差信号分别进行线性PCM编码,每个样值采用8bit量化,并规定在数字编码时,不使用A/D转换的整个动态范围,只给亮度信号分配220个量化级,黑电平对应于量化级16,白电平对应于量化级235;为每个色差信号分配225个量化级,色差信号的零电平对应于量化级128。这几个参数对PAL制和NTSC制都是相同的。
需要指出的是,新的分量编码标准还规定可选用10bit量化精度,以适应某些特殊应用。要实现8bit量化精度到10bit量化精度的转换,只需在8bit量化精度时对应的二进制编码的最低有效位后添加2个“0”bit即可。比如,对于8bit量化,亮度黑电平对应于量化级16(00010000);对于10bit量化,亮度黑电平对应于量化级64(0001000000),以此类推。由于这个标准制定得非常早,在现在的应用中,多数情况下量化位数都采用10bit量化。
根据需要,亮度数据和色差数据可以单独(同时)传输,或采用时分复用的方式传输。时分复用时每行的总样值(字)数为1716个,编号为0~1715(525/60标准),或为1728个,编号为0~1727(625/50标准)。
在数字有效行内复用数据的字数,对两种扫描标准而言都是1440个,编号为0~1439。在数字消隐期间复用数据的字数,对两种扫描标准而言则是不同的,625/50标准为288个字,编号为1440~1727,如图2-10所示;525/60标准为276个字,编号为1440~1715。
图2-10 625/50标准的复用数据的字数分布
时分复用、比特并行输出的4∶2∶2数字编码器原理如图2-11所示。输入的模拟信号
、
和
经过抗混叠低通滤波器后,进入各自的A/D变换器,输出的
Y
数字信号速率为13.5兆字/秒,抽样间隔为74ns;
C
B
和
C
R
数字信号的速率为6.75兆字/秒,抽样间隔为148ns。三个数字信号并行进入数字合成器(Combiner),以27兆字/秒的速率顺序读出
C
B
、
Y
、
C
R
的数据,每个字所占的间隔为37ns。图中样点编号表明,
C
B
和
C
R
样点与
Y
样点奇数位(1,3,5……)位置一致。
图2-11 时分复用、比特并行输出的4∶2∶2数字编码器原理
数字合成器输出数据的速率是27兆字/秒,三个分量信号按 C B 1 , Y 1 , C R 1 , Y 2 , C B 3 , Y 3 ……的顺序输出。前3个字( C B 1 , Y 1 , C R 1 )属于同一个样点的三个分量,紧接着的 Y 2 是下一个样点的亮度分量,它只有 Y 分量。每个有效行输出的第一个视频字应是 C B 。
数字分量标准规定不对模拟同步脉冲进行取样,而是在每一行的数字有效行数据流之中,通过复用方式加入两个定时基准信号。在行消隐期间留出8个数据字位置,用于传送定时基准信号,具体位置见图2-12和图2-13。对于525/60标准,其行定时信号EAV的位置是字1440~1443,定时信号SAV的位置是字1712~1715。对于625/50标准,EAV的位置是字1440~1443,SAV的位置是1724~1727。在场消隐期间,EAV和SAV信号保持同样的格式。
图2-12 625/50标准的数字行消隐及数据合成
每个定时基准信号由4个字组成,可用16进制计数符号表示为:3FF 000 000 XYZ 。前三个字是固定前缀,3FF、000和000三个十六进制数是为定时标志符号预备的,作为SAV和EAV同步信息的开始标志。 XYZ 代表一个可变的字,它包含确定的信息:场标志符号、场消隐的状态和行消隐的状态。图2-13表示了625/50标准的每帧定时基准信号的位置。
图2-13 625/50标准的数字定时基准信号
表2-2列出了构成SAV和EAV的4个字:3FF、000、000、 XYZ 的二进制数值。表中 XYZ 的bit0和bit1规定为二进制数0,以便与8bit量化接口兼容,bit9是1,bit6、7、8是可变的二进制数,分别用 H 、 V 和 F 表示,可表示以下三种信息:
1. F :场标志符
F =0,表示是在第1场期间; F =1,表示是在第2场期间。
2. V :场消隐标志符
V =0,表示有效场期间; V =1,表示场消隐期间。
3. H :行消隐标志符
H =0,有效行开始处(SAV); H =1,有效行结束处(EAV)。
字 XYZ 中的bit2、3、4、5的值也是可变的,并用 P 0 、 P 1 、 P 2 、 P 3 表示,它们的值取决于bit F 、bit V 和bit H 的值,可对 F 、 V 和 H 进行2bit误码检测以及1bit误码校正。表2-3列出了各行特定取样点的 XYZ 值的二进制数值,表明了 P 0 、 P 1 、 P 2 、 P 3 与 F 、 V 、 H 间的关系。
表2-2 定时基准信号(TRS)
表2-3 10bit十六进制XYZ数的二进制数值及其保护比特 P 0 、 P 1 、 P 2 、 P 3 与 F 、 V 、 H 的关系
除了EAV和SAV同步字以外,几乎所有的行消隐期和场消隐期都可以用来嵌入辅助数据。辅助数据分为行辅助数据HANC(Horizontal Ancillary Data)和场辅助数据VANC(Vertical Ancillary Data)。辅助数据在视频中的位置如图2-14所示。
图2-14 辅助数据在视频中的位置
1.时间码的传送。
在场消隐期传送纵向时间码(LTC)或场消隐期时间码(VITC)、实时时钟等其他时间信息和其他用户定义信息。
2.数字音频的传送。
在串行分量数字信号的水平消隐期间可传送多达16路符合AES/EBU标准的20比特量化的数字音频信号。
3.检测与诊断信息的传送。
插入误码检测校验字和状态标识位,用于检验传输后的校验字有效状态,以检测10比特数字视频接口的工作状况。
4.图像显示信息的传送。
在4∶3和16∶9画面宽高比混合使用的情况下,传送宽高比标识信令是必要的。
5.其他应用。
可以传送图文电视信号、节目制作和技术操作信令。由于数据空间足够大,甚至可以传送经过压缩编码的数字视频节目。国际标准化组织不断地对以上各种数据的格式及插入位置作出统一规定。
辅助数据分为行辅助数据(HANC)和场辅助数据(VANC)。允许10bit的HANC插在所有的数字行消隐内。从EAV开始到SAV结束是数字行消隐期,如图2-15所示。在每行数字行消隐期间从EAV结束到SAV开始前的部分可以传送一个小辅助数据块,数据块长不超过280个字(625/50标准)或268个字(525/60标准)。辅助数据的数据块都以三个字的数据头(或称数据首标)开始,分别为:000、3FF、3FF。
图2-15 625/50标准的数字消隐行内辅助数据的位置
为适应采用8比特的设备,必须把8比特设备的00和FF分别视为相当的000和3FF。场辅助数据(VANC)只允许插在场消隐期间的各有效行内(从SAV结束到EAV开始前),可以传输多达1440个字的大辅助数据块,但只能用8比特字,而且对可用的行有一定限制。在525/60标准中,只有在行1~19和行264~282不传送有用视频数据时,才能在其有效行部分插入辅助数据,在行10~19和行273~282之中也可能传送视频数据,这时就不能用于传送辅助数据,因为其中已规定第14行和第277行用于传送数字场消隐期间的时间码(DVITC)和视频导引信号。对于625/50标准,已规定第20行和第333行用于传送设备自检信号。
VANC信号是8比特字信号,每个数据块也以3个字的辅助数据头开始:000、3FF、3FF。为能适应10比特和8比特的设备,必须把8比特设备的00和FF分别看作等效的000和3FF。
在场消隐和行消隐期间,没有用于传送辅助数据的各个字必须硬性地填充以下数值:对应于 Y 样点的字必须填充16进制数值040;对应于 C B 和 C R 样点的字必须硬性地填充16进制数值200。
前面已经提到,在数字分量信号中是根据一定规范插入辅助数据的。辅助数据内包括数字音频、时间码、EDH以及预留的用户数据和控制数据。
辅助数据按一定的格式进入数据包,并与串行数据流复用传输。国际上,辅助数据包插入的位置由SMPTE 125M和SMPTE 269M文件规定。我国的广电行业标准GY/T 160-2000《数字分量演播室接口中的附属数据信号格式》对辅助数据的格式及插入位置进行了规范。图2-15和图2-16分别显示了625/50标准和525/60标准串行数字分量接口中规定的辅助数据的位置。图2-17显示了4∶2∶2数字分量接口标准中规定的辅助数据包的结构。
图2-16 525/60标准的数字行消隐内辅助数据的位置
图2-17 数字分量接口辅助数据包结构
每个数据包最多可载送262个10比特并行数据字。这些数据字是:
1.三个辅助数据标志字(ADF)。
它们的值分别为000、3FF、3FF,标志着辅助数据包的开始。
2.可选用的数据标识字(DID)。
这个字标识每个数据包的数据内容。当此内容是音频数据时,用几个不同的DID来定义4组可能的音频通路。
3.可选用的数据块计数字(DBN)或第二数据标识字(SDID)。
这个字使接收端能够通过计算具有共同DID数据包的个数,验证传送的完整性。在数据流切换和开关情况下,这个计数器能发出一个标志给声音处理系统,以一个适当的静音电路消除过渡现象,避免出现“噼啪”声和“喀呖”声。
4.数据数目字(DC):指示每个数据包内的用户数据字数量。
5.可变的用户数据字(UDW):最多容许255个字。
6.校验和字(CS):在接收端用来确定数据包的有效性。
复用的、邻接的辅助数据包可以插入任何辅助数据位置。但是,行辅助数据HANC必须紧随EAV之后,场辅助数据VANC必须紧随SAV之后。如果辅助数据位置的前三个字不是ADF,就认为辅助数据包没有出现。
关于数字音频的插入和复用,SMPTE 272M标准推荐两种基本工作模式。
1.最低AES实施标准。
最低AES实施标准为A级标准,其音频字分辨率为20比特,抽样频率为48kHz,音频数据与视频数据同步,只有一组4声道(2对立体声)音频通路,接收端缓存大小为48个音频抽样。
音频数据包是由AES/EBU信息数据流形成的。图2-18是一个AES/EBU数据流形成音频数据包的过程。图2-18显示出从一个AES/EBU串行数据流的第0帧的子帧1(通道1)抽出20个比特音频数据以及有关的 V (样值有效性)、 U (用户数据)和 C (通路状态)比特,总共23比特,映射成3个10比特辅助数据字 X 、 X +1和 X +2。放弃了原有的4个同步比特、4个辅助比特和奇偶校验比特,保留了3个辅助比特。
表2-4列出了3个10比特数据字 X 、 X +1和 X +2还原出的音频数据结构。其中有2个比特指示通道号,奇偶校验在前26个比特上计算,所有的b 9 地址比特除外。这3个字紧接着辅助数据头插入,见图2-18。
图2-18 从AES/EBU串行音频数据流形成的辅助音频数据包结构
同一个AES/EBU串行数据流中的第2路音频信息(通道2)以同样的方式插入。后续AES/EBU串行数据流的子帧接续插入,以完成一组音频(4路音频)的插入。所用的各种标志反映不同的通路识别和帧识别方法。AES/EBU规定,一个192帧的序列(从0到191帧)形成一个块。每一帧包含2个子帧(子帧1和子帧2)或通道(通道1和通道2)。形成一个辅助音频流时,2帧(4个子帧或4个通道)成为一组。每组包含2个抽样对,分别来自2个AES/EBU串行数据流。每个抽样对可用3种方法鉴别:
(1)AES1(CH1/CH2)和AES2(CH1/CH2);
(2)CH1/CH2和CH3/CH4;
(3)CH00/CH01和CH10/CH11。
表2-4 格式化的音频数据结构
续表
2.全AES实施标准。
全AES实施标准与几种工作能力相关联,这几种工作能力分为B级到J级,该标准的特点为:音频字分辨力为24bit;取样频率为32kHz、44.1kHz或48kHz;音频数据与视频数据可同步也可不同步;可插入多达4组4声道音频通路;接收端缓存大小为64个音频样点;具有任何一路音频与视频数据信号之间的延时指示。
为传输额外信息,增加了2个附加数据包。对于24bit量化级的工作模式,两个AES1子帧的4个附加比特组成一个8bit字,称为AES1信号的附加(AUX)字。所有AES信号的AUX字组成一个扩展数据包,如图2-19所示。这个数据包有同样的包头结构和一个符合规定的DID数码。它紧接与之相关的音频数据包插入辅助数据空位上。
图2-19 扩展数据包结构(24bit音频)
另外还定义了一个音频控制包,以传送下列信息:音频帧数、取样频率、有效音频通路数及每个音频通路相对视频的延迟时间等。对于最低AES实施标准,这个包是可自由选择的。但是对于全AES实施标准,这个包是必须的。图2-20所示的包是每场只传送一次的包,作为沿着第11行辅助数据空间出现的第一个包。
图2-20 音频控制包结构
音频数据插在位于行消隐区的三个辅助数据空间的最后一个空间内。若串行数据流的切换在第9行进行,则不推荐在紧接着后一行的行辅助数据空间插入音频数据。在接收端的解复用器中必须有一个64样点的缓存器,以无缝隙地还原数字音频信号。
有些设备是在标准制定之前设计和制造的,音频数据插入位置与标准规定不完全符合时会出问题,导致插入的音频数据部分丢失,严重降低伴音质量。例如,有些数字录像机、帧同步机和编解码器,为了降低比特率,在信号处理之前抽出了行、场消隐期间的数据,不能透明地记录或处理完整的数字音频信号,而在设备的输出端再加上行、场消隐。某些设备在输入端把辅助数据完整地抽取出来,存储在存储器里,而在输出端重新插入。因此,在采用音频嵌入视频的方式处理和传送数字信号时,应注意系统中各设备能否按推荐标准处理辅助数据,适当地进行系统配置和音频信号传送。
国际电信联盟的ITU-R BT.709建议提出了两种HDTV节目制作及节目交换用的HDTV参数,一种是隔行扫描数字HDTV视频格式,另一种是方型像素通用高清晰度视频格式。参考方型像素通用高清晰度视频格式,我国在2000年颁布了GY/T 155-2000《高清晰度电视节目制作及交换用视频参数值》标准,具体参数见表2-5。
表2-5 我国高清晰度电视节目制作数字参数表
续表
我国HDTV标准采用分辨率为1920×1080,帧频为25Hz的隔行扫描方式。从表2-5可以看出,我国高清晰度数字电视编码在信号的取样结构、编码方式、量化以及量化电平的分配等处理方面在原理上与标准清晰度电视完全相同,只是高清晰度数字电视参与编码的信号可以是 R 、 G 、 B 分量格式。
由于每帧总行数是1125行,帧频为25Hz,则行频为1125×25Hz=28 125Hz。信号标称带宽为30MHz, R 、 G 、 B 、 Y 的取样频率为2.25MHz的整数倍,且大于2.4倍的标称带宽,所以, R 、 G 、 B 、 Y 的取样频率为33×2.25MHz=74.25MHz。色差信号的取样频率为亮度取样频率的一半,为74.25MHz/2=37.125MHz。这样每行 R 、 G 、 B 、 Y 的总样点数为 R 、 G 、 B 、 Y 的取样频率/行频=74.25MHz/28125Hz=2640;由于色差信号取样频率降低一半,每行色差信号的总样点数也减少一半,为1320个样点。
此外,为了传输并重现丰富的彩色效果,我国高清晰度电视标准还采用了扩展色域的方法:通过保留已有的基色荧光粉坐标的彩色编码方式,扩大摄像机的 R 、 G 、 B 三基色信号动态范围来扩展色域。由于电视系统所需的信号动态范围取决于基色坐标、光电转换特性和需要传输的颜色范围,要使电视系统传输并重现的扩展色域能够覆盖相应标准规定的彩色范围,经过校正后的 R 、 G 、 B 信号的动态范围应在-0.23~1.15之间。这一动态范围超出了现行电视系统规定的信号幅度范围,要重新进行量化电平的分配。
标准还包括了24p格式参数,这是符合电影规范的逐行扫描方式,主要是为了适应运用数字电影制作高清电视节目或使用高清电视设备制作数字电影的情况,便于电影和高清电视节目之间的转换。24p格式参数见表2-6。
表2-6 24p格式参数
续表
与数字标清信号一样,数字高清晰度数字信号为二进制编码,信号中包括8bit字或10bit字的视频数据、定时基准码和辅助数据等信息。
我国的数字高清晰度电视演播室参数标准规定,一帧图像的有效亮度及三个基色信号的像素数各为1920×1080,两个色差信号像素各为960×1080。并行传输时,两个色差信号按次序进行时分复用,如果是串行传输还要对亮度信号和复用后的色差数据进一步进行时分复用。如果是三基色信号,要对 R 、 G 、 B 数据进行时分复用后,再形成串行数据。
对于并行传输的数据格式,亮度信号和经过时分复用后的色差信号处理为并行的20bit数据字,每个20bit数据字对应一个色差取样和一个亮度取样,复用次序是( C B 1 Y 1 )、( C R 1 Y 2 )、( C B 3 Y 3 )、( C R 3 Y 4 )……括号里是并行的20bit的数据字。 R 、 G 、 B 信号通常被处理成30bit的数据字。这样,对于并行传输的数字高清晰度电视,色差分量格式一行共有2640个20bit的数据字, R 、 G 、 B 分量格式一行共有2640个30bit的数据字。一行中用于传输视频信号的有效数据字为1920个。一行数字高清晰度电视的并行传输的数据格式如图2-21所示。
图2-21 高清1125/50标准的数字行消隐及数据合成
下面着重介绍一下1125/50隔行扫描系统的定时关系。
模拟高清晰度电视采用三电平同步脉冲,该脉冲波形先低于消隐电平,然后又高于消隐电平,在三电平同步脉冲中的定时基准位于同步基准的上升时期与消隐电平相交处,模拟高清视频行起始于三电平同步脉冲的定时基准处,结束于下一行的三电平同步脉冲的定时基准处。同步脉冲电平幅度为±300mV,正负同步电平之间的幅度差应不超过6mV,三电平同步脉冲的波形及参数如图2-22所示。行频28 125Hz的倒数就是模拟行周期,时长为35.556μs;1920乘以取样周期1/74.25MHz可得到模拟行正程,时长为25.859μs;行周期减去行正程可得到模拟行消隐,时长为9.697μs;其中,消隐前肩规定为6.518μs,消隐后肩规定为1.993μs,其正向和负向同步脉冲宽度各为0.593μs。
图2-22 三电平同步脉冲的波形及参数
由于数字高清晰度电视视频信号是由模拟高清晰度视频信号经过A/D转换得到的,那么,在高清数字视频信号与模拟视频信号之间存在明确的定时关系。图2-23给出了高清数字视频数据流与模拟行波形之间的详细关系,表2-7是两者之间的详细的定时参数。每行35.556μs内有2640个亮度或基色信号取样周期,数字行开始于相应行的模拟同步信号的基准点( O H )前528个亮度取样周期处;数字有效行开始于相应行的模拟同步信号的基准点( O H )后的192个亮度取样周期处,有效行长度为1920 T ( T 为抽样间隔);数字消隐起始于模拟行同步前沿 O H 前528个亮度周期处,其长度为720 T 。消隐行左端有4 T 的定时基准EAV,EAV代表有效视频结束;EAV之后是各2 T 的行号和CRC循环校验码;右端有4 T 的定时基准SAV,SAV代表有效视频开始。其中, T 代表亮度或基色信号的抽样周期(间隔), T =1/74.25MHz=13.48ns。
表2-7 1125/50高清数字行与模拟定时参数
续表
图2-23 数字高清并行数据格式与模拟视频波形关系
隔行扫描数字高清晰度电视视频系统的模拟场与数字场之间的详细定时关系如图2-24和图2-25所示。从图中可以看出,两者存在比较一致的定时关系,其行号和奇偶场次序是一致的,差别在于模拟信号的奇偶场分界点在第563行的中间,而数字信号的奇偶场分界点则在563行的结束,这就可以避免对半行信号进行处理。第1场的第1行到20行为数字场消隐,第21行到560行是数字有效视频行,第561行到563行为第1场的数字场消隐;第2场的第564行到583行是数字场消隐,第584行到1123行是第2场的数字有效视频行,第1124行和1125行为第2场的数字场消隐。需要说明一下的是,这里的行数指的是在数据传输、处理过程中按照时间顺序计数的行数,并不是在屏幕上从上往下数的行数。
图2-24 隔行扫描系统高清模拟视频场定时关系
图2-25 隔行扫描系统高清数字视频场定时关系
定时基准SAV表示每个视频数据块的开始,EAV表示每个视频数据块的结束。定时基准EAV和SAV中的 F 、 V 、 H 各位的取值表示 F 、 V 、 H 的状态,高清数字视频定时基准的组成和各比特位的分配以及保护比特的构成方式与标清数字视频的视频定时基准码是一致的,具体可参看标清部分有关内容。高清的逐行扫描系统的 F 、 V 、 H 取值表示的状态有别于隔行扫描系统,逐行扫描方式下,由于不分奇偶场, F 恒为0。图2-26是1125/50隔行扫描系统的 F 、 V 、 H 的取值。
图2-26 1125/50隔行扫描系统的 F 、 V 、 H 的取值
与标清数字视频不同,在数字高清晰度视频数据格式的EAV之后,附加了4个数据字,如图2-27所示。
图2-27 数字高清并行数据格式辅助数据字
其中有两个数据字的行编号(LN1和LN0),这是一个11bit的二进制行计数器,用于指示行号,这11bit分布在数据字LN1和LN0中,具体分布如表2-8所示。第9位为最高位,数值为第8位数值取反。第0位为最低位。R位为保留位,置0。L10至L0是二进制的行编号。比如第1024行,二进制行编号是L10~L0=100 0000 0000B,数据字LN0=10 0000 0000B,数据字LN1=10 0010 0000B。
表2-8 行编号数据字中各比特位分布
紧跟着行编号数据字的是两个数据字的CRC循环冗余校验码。由于在高清晰度视频数据格式下,亮度和色差数据是并列排列的,因此,有色差和亮度两种CRC循环冗余校验码,分别对每行的亮度数据和色差数据按照公式CRC(x)= x 18 + x 5 + x 4 +1进行计算,得到亮度校验字(YCRC0和YCRC1)和色差校验字(CCRC0和CCRC1),用于校验数字有效行的错误,计算的范围是每一个有效行的起始数据字到该行的行编号的最后一个数据字。
需要说明一下,在数字高清视频信号的消隐期可以传送辅助数据字,如不传送辅助数据字,则发送消隐电平数据, Y 、 R 、 G 、 B 信号消隐期的消隐电平数据是64(十进制),色差信号 C B 和 C R 消隐期的消隐电平是512(十进制),与标清时的填充要求是一样的。
基于数字电视技术的不断进步,超高清晰度电视也随着人们对视频展现技术要求的不断提高而出现了。2004年7月1日,数字电影促进会(Digital Cinema Initiatives,DCI)修订并推出了数字影院技术规范草案4.0版,首次提出了4K(4096×2160或3840×2160)的概念。后来又提出了8K的概念。有一种观点认为,8K(8192×4320或7680×4320)分辨率的超高清晰度电视已经足以满足正常巨幕电影所需要的分辨率要求,更高的分辨率已经没有实际意义。
超高清晰度电视与高清晰度电视的区别不仅仅体现在前者的分辨率更高。随着技术的进步,显示器件的表现能力也已远非当初的显像管所能比拟的。为了能够更逼真地还原大自然的色彩与声音,超高清晰度电视在信号扫描频率、色域、信号的量化比特数、动态范围、音频的声道数量等方面都采用了更高的标准。
ITU-R BT.2020超高清晰度电视标准采用了基于国际照明委员会(法语简称CIE)1931 XYZ的RGB色彩空间,将超高清晰度电视系统的 R 、 G 、 B 三基色色度坐标选在了可见光谱色轨迹上,几乎包含了全部真实表现色,沿用了HDTV系统基准白(Rec.709的D65标准),用色彩度极高的三基色实现了全新的宽色域系统。
超高清晰度电视的色域空间要比高清晰度电视(ITU-R BT.709标准)的色域空间大不少,从标准色域范围的覆盖面积来看,超高清晰度电视是CIE 1931的75.8%,而高清晰度电视仅为35.9%。超高清晰度电视色域标准更加接近数字电影的技术标准,能够显示更加丰富的色彩,使人眼的视觉色彩感受更加逼真。
超高清晰度电视全部采用了“逐行扫描”方式(简称p),取消了“隔行扫描”方式(简称i)。中华人民共和国广播电影电视行业标准GY/T 307-2017对超高清晰度电视节目制作和交换参数做了具体的规定,如表2-9到2-13所示。
表2-9 图像空间特性
表2-10 图像时间特性
表2-11 系统光电转换特性及彩色体系
表2-12 信号格式
表2-13 数字参数
超高清晰度电视的伴音应支持立体声或5.1环绕声,有条件的应支持三维声。音频的量化比特数采用24比特,取样频率为48kHz。
需要说明一下,在高清电视及以前的标清电视系统中,亮度信号( Y )表示的并不是最原始的亮度信息(非恒定亮度)。这是由伽玛校正和亮度信号的计算顺序导致的。在高清及标清系统中,是先对 R 、 G 、 B 信号进行伽玛校正,再利用亮度方程计算亮度信号的值。在超高清晰度电视系统中,在对亮度信号要求严格的情况下,有时需要采用先计算亮度信号(恒定亮度),再进行伽玛校正的方式。
为了方便演播室数字视频设备之间的互相连接,ITU-R BT.656建议书规定了标清数字信号的接口标准,我国参考该建议制定了国家标准GB/T 17953《4∶2∶2数字分量图像信号的接口》。标准主要规定了视频数据格式、接口信号结构、视频定时基准、辅助数据及消隐期数据字、比特并行接口和比特串行接口。下面简要介绍一下比特并行接口和比特串行接口。
数字视频信号复用以后,信号以 C B 0 、 Y 0 、 C R 0 、 Y 1 、 C B 1 、 Y 2 、 C R 1 ……这样的顺序进行10比特传输,在并行接口中使用10对导线平衡传输10个并行比特的NRZ(不归零)码。为了使接收端获取定时信息,还需要用一对导线传输27MHz的时钟信息。此外,收发两端需要一对公共地连接线及电缆的屏蔽线。因此,比特并行接口采用25芯电缆,内有12对双绞线。
比特并行接口由于电缆接口复杂、电缆较粗,适应的传输距离较短,且使用不方便,实际上在设备之间很少使用。使用比较多的场合主要是作为设备内部板卡之间的连接接口,还有电路板中视频处理芯片之间的连接接口,采用并行接口可以较低的码率传输数字视频信号。
采用比特串行方式传输数字视频信号比用比特并行方式经济得多,所有的数字视频数据、同步信息、辅助数据以及几路AES/EBU标准数字音频都可以通过一根电缆在电视节目制播区域内传输。在很多情况下,现有的视频电缆都可用来传输串行数字信号,图2-28是一个简单的比特串行数字视频信号传输模型。
图2-28 比特串行数字视频信号传输模型
在图2-28中,比特并行数字信号经过并/串变换,再由通道编码变换成比特串行数字信号(NRZI,倒置的NRZ码),以符合传输标准。信号在传输到接收端时将会增加噪声,噪声过大会破坏有用信号,甚至产生比特误码或比特丢失,影响接收端的通道解码。接收端的通道解码将NRZI码还原为NRZ码,并将串行比特信号变成并行比特信号。
对于并行接口来说,10位并行码在10根传输线上对 Y 、 C R 、 C B 进行时分复用,采用非归零码进行传输,每条传输线上的传输码率为27Mbit/s,传输顺序如图2-29所示,每一个有效行的起始是 C B 0 ,它与邻接的 Y 0 、 C R 0 为同取样点的亮度和色度取样信号。为了便于接收端恢复数据,专门增加一个传输线传送时钟信号,时钟周期为37ns。
图2-29 625/50标准的并行数字信号传输顺序
并/串转换是将并行数字信号转换成串行数字信号,转换按照并行数据的最低有效位在前,并行数据的最高有效位在后的原则进行。转换后的串行数据的传输顺序如图2-30所示。
图2-30 串行码传输顺序
比特串行数字信号的比特率为:比特并行数字信号的波特(兆字/秒)×比特数/字,4∶2∶2串行分量数字信号的比特率为:27兆字/秒×10bit/字=270Mbit/s。
图2-31展示出几种常规电视的串行数字信号之频谱,这是典型的非归零(NRZ)码的频谱,在时钟频率及其整数倍的频率上出现零点。显然,传输串行数字信号需要很宽的频带,在演播室内是能满足这个频带要求的。但在远距离的电缆、光缆传输、地面广播或通过卫星传输时都需要压缩码率以适合当时的标准信道容量。
图2-31 各种格式的串行数字信号频谱
通道编码确定数据流进入通道时0和1的变化方式,也就是0和1以什么样的波形呈现出来。各种通道编码的目的都是使串行数字信号形状得到优化,从而使信号频谱的能量分布相对集中,降低直流分量,有利于时钟恢复等。
最简单、应用最多的信道码是非归零码(NRZ)。NRZ码的特征是:对逻辑1规定一个相对高的直流电平,对逻辑0规定相对低的直流电平。串行数字信号在传输时并不附带传送时钟信号,需要在接收设备中用一个锁相环(PLL)和压控振荡器(VCO)重新产生时钟信号,锁相环通过数字信号中0到1或1到0的跳变沿进行锁定。NRZ码可能出现连0和连1的状态,这样就在一段时间内失去了0和1的转换,锁相环就失去了基准,这段时间内在接收端数据再生的取样精度就取决于VCO的稳定度了。另外,NRZ码有直流分量。其大小随数据流本身的状态改变,还有明显的低频分量,这不适合交流耦合的接收设备。鉴于以上原因,在串行数字视频传输中不采用NRZ码的基本形式。
串行数字视频信号传输采用倒置的NRZ码,称NRZI码(NRZ Inverted Code)。图2-32展示了一段NRZ码数字信号以及由它生成的NRZI码信号。NRZ码是逻辑1时,NRZI码的电平变化;NRZ码是逻辑0时,NRZI码的电平保持不变。在NRZ码信号为很长的连续1时,其NRZI码就成为方波信号,其频率是时钟频率之半。因此,NRZI码在每个时间单元内比NRZ码有更多的电平变换次数,即脉冲沿增多,这可改进接收端时钟再生锁相环的工作,从而稳定地产生时钟信号。显然NRZI码的极性并不重要,只要检测出电平变换,就可以恢复数据,所以NRZ码是极性敏感码,而NRZI码是极性不敏感码。
图2-32 NRZ码和NRZI码的特征
NRZI码虽然比NRZ码优越,但它仍有直流分量和明显的低频分量。为进一步改进接收端的时钟再生,可采用扰码的方法(Scrambling)。扰码器使长串连0和连1序列以特定的重复方式伪随机化,扰乱的结果是限制了直流分量,提供了足够的信号电平转换次数,保证时钟恢复可靠。
为什么一定要从接收的码流中恢复时钟?原因很简单。在通道的接收端要靠时钟来进行解码,如果让接收端自由地产生时钟,由于其频率与接收码流存在差别,要么因时钟频率偏高而造成码字重复,要么因时钟频率偏低而导致码字丢失。所以,必须让接收端的时钟与接收的数据流的时钟良好地锁定。合理选择码型,有利于时钟的恢复。
图2-33是加扰器和NRZI编码器。加扰器产生伪随机二进制序列(PRBS),伪随机二进制序列与传送数据组合起来,使传输的数据具有随机化特性。加扰器由9级带反馈的移位寄存器组成,移位寄存器由9级时钟触发的主从D触发器构成,如图2-33所示。反馈信号通过异或门与传送数据合成到一起。在图2-33中,加扰序列用生成多项式表示为G 1 ( x )= x 9 + x 4 +1。
图2-33 加扰器和NRZI编码器
加扰器可能会产生长串连续1序列,但在加扰器后接有NRZ到NRZI变换器,将连续1变成电平不断转换的形式,可参见图2-32所示波形。NRZI变换由一级带一个异或门的主从型D触发器组成,NRZI变换器的生成多项式为 G 2 ( x )= x +1。
在接收端,传送数据首先通过NRZI到NRZ变换器,用同样的生成多项式,进行相反的运算,还原出NRZ码,再通过解扰器,如图2-34所示。其生成多项式与加扰器的生成多项式相同,但在电路中用前馈代替了发端的反馈,用同样的伪随机序列进行相反的运算,恢复出原始数据。
图2-34 NRZI解码器和解扰器
我国广播电视行业标准GY/T 157-2000《演播室高清晰度电视数字视频信号接口》规定了高清晰度电视的接口参数。
高清晰度视频信号并行传输的数据字为20bit或30bit。对于4∶2∶2编码的演播室视频信号,亮度信号 Y 和时分复用的色差信号 C B / C R 并行传输,数据字为20bit,采用20对屏蔽导线进行传输,也可以附加一个10bit的辅助数据流通道,构成30bit的传输通道;对于 R 、 G 、 B 信号,三路信号进行并行传输,数据字为30bit,采用30对屏蔽导线进行传输;此外,加上一对屏蔽导线传输同步时钟信号。不论哪种并行传输方式,其传输的比特率都是74.25兆字/秒,只是数据字长度可能是20bit或30bit。
并行传输的每个线路驱动器是平衡输出,相应的线路接收器是平衡输入。线路驱动器输出阻抗110Ω,相对于地的共模电压为-1.29(1±15%)V;加110Ω匹配负载时,信号幅度峰值为0.8~2.0V;时钟抖动±0.04Tck,1Tck=1/74.25MHz=13.468ns;数据定时容差±0.075Tck;各导线之间的延时差±0.18Tck。
数字高清晰度视频比特串行接口传输的数据流包括视频数据、视频定时基准、行号、校验码、辅助数据和消隐数据。在并行传输中,亮度数据和复用后的色差数据 C B / C R 是并行的数据,数据字长度各为10bit。两个并行比特流经过复用、并串转换和加扰后转换成串行比特流,通过单一通道进行传输。
复用就是把两个并行码流10bit亮度数据 Y 码流和10bit复用后的色差数据 C B / C R 码流合成一个串行10bit数据流,复用后的数据流按照 C B , Y , C R , Y , C B , Y , C R ,……的顺序传输。
复用的具体过程如图2-35所示。图中, Y D0 ~ Y D1919 表示 Y 信号的数字亮度数据: C BD0 ~ C BD 959 表示 C B 信号的数字色差数据; C RD 0 ~ C RD 959 表示 C R 信号的数字色差数据; Y A 0 ~ Y A 707 表示亮度数据流 Y 中的辅助数据或消隐数据; C A 0 ~ C A 707 表示色差数据流 C B / C R 中的辅助数据或消隐数据; T =1/74.25MHz=13.468ns, T S =1/2 T 。
两个传输码率为74.25兆字/秒的10bit的数据流复用成一个10bit的数据流,其传输码率为2×74.25兆字/秒=148.5兆字/秒,再通过并串移位寄存器,以148.5MHz时钟写入移位存器,使用10倍时钟(1485MHz)按照最低有效位在先,最高有效位在后的次序读出,得到传输码率为1485Mbit/s的不归零自然码串行数据流。
图2-35 1125/50隔行扫描系统信号的数据流
此外,为了传输,还要进行传输信道处理,对串行数据流进行扰码和编码,其处理方式与标清串行数字流的扰码和编码类似,这里不再重复。
随着分辨率的提高和扫描格式改为逐行,超高清晰度电视的数据码率也显著提高。以4∶2∶2采样为例,我们知道1920×1080/50i高清晰度电视的数据码率为1.485Gbps,大约是1.5Gbps,而4K超高清晰度电视的像素是高清晰度电视的4倍,并且是逐行扫描,可以得到4K超高清晰度电视的数据码率是12Gbps。这么高的数码率要进行传输是很困难的,除了传统的SDI传输方式之外,也采用TCP/IP传输方式。SDI接口有3Gbps、6Gbps、12Gbps等接口标准。随着数码率的提高,同轴电缆的有效传输距离将迅速缩短。为了解决这个问题,多采用光纤传输的方法。4K超高清晰度电视12Gbps的数码率,在早期实践中多采用4条3Gbps电缆传输的方法。可采用两种传输方式,一种是把画面分为左上、右上、左下、右下4个高清晰度电视画面分别编码传输,到接收端再把四个高清晰度电视画面合成为一个4K超高清晰度电视画面。另一种是从左上角开始,把紧邻两行的8个像素分为4组,分别通过4个通道传输。如图2-36所示。这两种传输方式各有优缺点:第一种方式很容易判断哪一路传输出现故障,但是如果各通路的传输时延过大,会出现四个画面不同步的问题。第二种方式,只要有一路正常工作,就会有完整的画面展现,而且不会出现整幅画面不同步的问题。8K超高清晰度电视的数据码率在4∶2∶2采样,场频为50Hz时,码率可以达到48Gbps,这么高的数码率,对数据的存贮和传输都是一个很大的挑战,可以预见采用TCP/IP传输是将来发展的方向。
图2-36 4K超高清晰度电视的4通道3Gbps传输
1.本模块主要讲述了数字电视信号形成的过程:取样、量化、编码。取样是把模拟信号在时间上离散化的过程,把时间上连续的模拟信号用有限个时间点的样值来表示,取样后的样值信号在幅度上还是连续的模拟量。量化的过程是把幅度上连续的模拟量用有限个量值来代表,量化的过程会引入量化误差,通常称为量化噪声。编码是对取样、量化后的离散数字信号进行处理,以便于在信道中进行传输。
2.音频信号常用的取样频率有32kHz、44.1kHz和48kHz等,电视摄像机经常采用的音频量化比特数有16比特和24比特,因为采用的量化比特数已经相对足够多,所以,一般情况下数字电视的伴音采用线性量化。
3.视频信号的数字化有复合编码和分量编码两种编码方式。复合编码是将彩色全电视信号直接编码成PCM形式;分量编码是将亮度信号及两个色差信号(或三个基色信号)分别编码成PCM形式。分量编码在各种电视制式之间进行节目制式转换更为方便,所以数字电视演播室标准采用分量编码方式。
4.在我国采用的标准中,标准清晰度电视亮度信号的采样频率为13.5MHz,高清晰度电视亮度信号的采样频率为74.25MHz。标清和高清电视的量化比特数可以取8比特或者10比特,现在多采用10比特量化。在采用10比特量化的系统中共有1024个数字电平(2 10 个),用十六进制表示时,其数值范围为000~3FF。数字电平000~003和3FC~3FF为储备电平或保护电平,这两部分电平数值是不允许出现在数据流中的,因为这些数值要留作他用,比如000和3FF就用于传送同步数据。从004~3FB即十进制数的4~1019代表亮度信号电平;消隐电平定为040;峰值白电平定为3AC。有关标准规定数字电平可以留有很小的余量,底部电平余量为004~040,顶部电平余量为3AC~3FB,这是标准中容许的黑电平和白电平“过冲”。色差信号的电平是双极性的,而A/D转换器需要单极性信号,处理方法是将色差信号的电平上移350mV。色差信号的消隐电平(即零电平)定为200(十六进制数)。
数字视频分量编码亮度信号和色差信号的取样安排采用正交取样结构,有4∶4∶4、4∶2∶2、4∶2∶0和4∶1∶1四种取样结构。演播室多采用4∶2∶2的取样结构。
5.根据需要,亮度数据和色差数据可以单独(同时)传输,或采用时分复用的方式传输。采用时分复用的方式传输时,亮度和两个色差这三个分量信号按 C B 1 , Y 1 , C R 1 , Y 2 , C B 3 , Y 3 ……的顺序输出。前3个字( C B 1 , Y 1 , C R 1 )属于同一个样点的三个分量,紧接着的 Y 2 是下一个样点的亮度分量,它只有 Y 分量。每个有效行输出的第一个视频字应是 C B 。
6.数字分量标准规定不对模拟同步脉冲进行取样,而是在每一行的数字有效行数据流之中,通过复用方式加入两个定时基准信号。在行消隐期间留出8个数据字位置,用于传送定时基准信号EAV和SAV。
除了EAV和SAV同步字以外,几乎所有的行消隐期和场消隐期都可以用来嵌入辅助数据和伴音信号。辅助数据分为行辅助数据HANC(Horizontal Ancillary Data)和场辅助数据VANC(Vertical Ancillary Data)。
7.与标清数字视频不同,在数字高清晰度视频数据格式的EAV之后,附加了4个数据字,其中有两个数据字的行编号(LN1和LN0),这是一个11bit的二进制行计数器,用于指示行号。紧跟着行编号数据字的是两个数据字的CRC循环冗余校验码,由于在高清晰度视频数据格式下,亮度和色差数据是并列排列的,因此,有色差和亮度两种CRC循环冗余校验码。
8.基于数字电视技术的不断进步,超高清晰度电视也随着人们对视频展现技术要求的不断提高而出现了。2004年7月1日,DCI修订并推出了数字影院技术规范草案4.0版,首次提出了4K(4096×2160或3840×2160)的概念。后来又提出了8K的概念。超高清晰度电视与高清晰度电视的区别不仅仅体现在前者的分辨率更高。随着技术的进步,显示器件的表现能力也已远非当初的显像管所能比拟的。为了能够更逼真地还原大自然的色彩与声音,超高清晰度电视在信号扫描频率、色域、信号的量化比特数、动态范围、音频的声道数量等方面都采用了更高的标准。超高清晰度电视全部采用了“逐行扫描”方式(简称p)。
9.在高清晰度电视及以前的标准清晰度电视系统中,亮度信号( Y )表示的并不是最原始的亮度信息(非恒定亮度)。这是由伽玛校正和亮度信号的计算顺序导致的。在高清晰度及标准清晰度电视系统中,是先对 R 、 G 、 B 信号进行伽玛校正,再利用亮度方程计算亮度信号的值。在超高清晰度电视系统中,在对亮度信号要求严格的情况下,有时需要采用先计算亮度信号(恒定亮度),再进行伽玛校正的方式。
10.为了方便演播室数字视频设备之间的互相连接,ITU-R BT.656建议书规定了标准清晰度数字电视信号的接口标准,我国参考该建议制定了国家标准GB/T 17953《4∶2∶2数字分量图像信号的接口》。标准主要规定了视频数据格式、接口信号结构、视频定时基准、辅助数据及消隐期数据字、比特并行接口和比特串行接口。
比特并行接口由于电缆接口复杂、电缆较粗,适应的传输距离较短,且使用不方便,在设备之间很少使用,其使用比较多的场合主要是作为设备内部板卡之间的连接接口,还有电路板中视频处理芯片之间的连接接口,采用并行接口可以较低的码率传输数字视频信号。
采用比特串行方式传输数字视频信号比用比特并行方式经济得多,所有的数字视频数据、同步信息、辅助数据以及几路AES/EBU标准数字音频都可以通过一根电缆在电视节目制播区域内传输。
比特并行数字信号经过并串变换,再经通道编码变换成比特串行数字信号(NRZI,倒置的NRZ码),以符合传输标准。
通道编码确定数据流进入通道时0和1的变化方式,也就是0和1以什么样的波形呈现出来。各种通道编码的目的都是使串行数字信号形状得到优化,从而使信号频谱的能量分布相对集中,降低直流分量,有利于时钟恢复等。
NRZI码虽然比NRZ码优越,但它仍有直流分量和明显的低频分量。为进一步改进接收端的时钟再生,可采用扰码的方法。扰码器使长串连0和连1序列以特定的重复方式伪随机化,扰乱的结果是限制了直流分量,提供了足够的信号电平转换次数,保证时钟恢复可靠。
11.随着分辨率的提高和扫描格式由隔行改为逐行,超高清晰度电视的数据码率也迅速提高。以4∶2∶2采样为例,我们知道1920×1080/50i高清晰度电视的数据码率为1.485Gbps,大约是1.5Gbps,而4K超高清晰度电视的像素是高清晰度电视的4倍,并且是逐行扫描,可以得到4K超高清晰度电视的数据码率达12Gbps。这么高的数码率要进行长距离传输是很困难的,在传统的SDI传输方式之外,也采用TCP/IP传输方式。
思考与练习
1.我国标准采用的高清晰度与标准清晰度电视的取样频率分别是多少?超高清晰度电视的取样频率可能会是多少?
2.数字视频信号的像素都是方形像素吗?
3.数字电视中音频信号常用的取样频率有哪几个?
4.我国1080/50i高清电视采用4∶2∶2采样时,视频信号的数码率是多少?
5.说明625/50标准的数字行内定时基准信号EAV、SAV的位置。
6.恒定亮度与非恒定亮度的区别是什么?
7.说明高标清视频信号中定时基准信号的区别。
8.采用10bit量化时,亮度信号电平的取值范围是多少?
9.数字电视的复合编码和分量编码的定义是什么?
10.电视演播室数字编码的国际标准是复合编码还是分量编码?这种编码方式的优点是什么?
11.请说明数字电视4∶2∶0样值结构。
12.625/50标准的数字电视采用4∶2∶2样值结构时奇数场与偶数场的行数是否一样?数字有效行分别是多少?
13.计算ITU-R601标准625/50和525/60制式中每行的亮度采样点数分别是多少。
14.说明ITU-R601标准数字电视亮度信号和色差信号的传输顺序。
15.说明数字电视定时基准信号的构成。
16.说明数字电视辅助数据(ANC)的应用
17.说明我国高清晰度数字电视标准的数字行内定时基准信号EAV、SAV的位置。
18.我国高清晰度数字电视标准奇数场与偶数场的行数是否一样?数字有效行分别是多少?
19.与标准清晰度数字电视相比,高清晰度数字电视的辅助数据多了行号和循环校验字的内容,说明它们的位置和大体结构。
20.串行数字视频信号在信道中一般是怎样传输的?