现代通信技术基础及应用最新章节_梁腾著

2.2 信源编码

信源编码是一种以提高通信有效性为目的而对信源符号进行的变换，或者说为了减少或消除信源冗余度而进行的信源符号变换。具体来说，通过某种方法，能把信源输出符号序列变换为最短的码字（码字指利用哈夫曼码编码后的信号，由若干个码元组成，在计算机通信中表现为若干位二进制码）序列，使后者的各码元所承载的平均信息量最大，同时又能保证无失真地恢复原来的符号序列。信源编码可以看作信息做“减法”的过程，它提高了数字信号的有效性、经济性和速度，其最常见的应用形式是压缩。

摩尔斯码是最原始的信源编码，ASCII码和电报码也都是信源编码。在现代通信应用中常见的信源编码方式有哈夫曼编码、算术编码、L-Z编码，都属于无损编码。另外还有一些有损的编码方式。

如果是模拟信源，则需要采用模/数转换，将模拟信号数字化，再进行压缩编码，减少对传输带宽的占用。如GSM系统中先通过脉冲编码调制（PCM）将模拟语音信号转换成104kbit/s的二进制数字码流，再利用RPE-LTP算法对其进行压缩，最终输出13kbit/s的码流，压缩比为104/13，即8∶1。

2.2.1 模拟信号的数字化处理

模拟信号数字化处理包括三个过程：抽样、量化和编码，也称为脉冲编码调制。如图2-5所示。

图2-5 脉冲编码调制

a）抽样 b）量化 c）编码

1）抽样：把时间连续的模拟信号转换成时间上离散、幅度连续的抽样信号。

2）量化：把时间离散、幅度连续的抽样信号转换成时间离散、幅度离散的数字信号。

3）编码：将量化后的信号编码形成多位二进制码组成的码组表示抽样值，完成模拟信号到数字信号的转换。

编码后的二进制码组经数字信道传输，在接收端经过译码和滤波还原为模拟信号。

通信系统中的模拟信号的数字化过程一般由ADC来完成，即模/数转换器。数字信号模拟化过程由DAC完成，即数/模转换器。

PCM是数字程控电话交换机系统中广泛采用的语音编码方案，随着数字信号处理技术和微电子技术的发展，PCM技术可直接由集成芯片实现。

信源编码可以分为音频编码和图像编码，两者都是针对信源发送信息所进行的压缩编码，但其信息的结构、显示方式及要求不同，因此具有不同的发展规律。

2.2.2 音频编码技术

音频编码技术的目标是在给定编码速率的条件下，用尽量小的编解码延时和算法复杂度，得到尽可能好的重建音频质量。

1.音频编码的性能指标

根据音频编码技术目标，衡量音频编码技术好坏的指标包括音频质量、编码速率、编解码延时和算法复杂度等，在不同场合要求下，侧重点有所不同。

（1）音频质量

音频质量与音频的带宽有关，一般来说频率范围越宽，音频质量也就越高。在不同的应用场合，对音质的要求有所不同，见表2-1。

表2-1 音频类型及带宽

评价音频编码质量的方法分为主观评定和客观评定。主观评定是依照人的听觉来评定，主观性较强，可靠性不高；客观评定是对音频的某些特性参数进行定量分析后得出结论，评定方法相对标准，但无法完全反映人对音频质量的感觉。目前，更加符合主观感知的客观评定方法还在不断改进。

（2）编码速率

编码速率指模拟信号经过抽样、量化和编码之后产生的数字信号的信息传输速率，单位为比特/秒（bit/s），也可以用“比特/样值”表示，比特/样值越大，即用越多的二进制位数表示一个样值，量化就越细，音频质量越容易提高，但相应地对传输速率、带宽、存储容量的要求也越高。如电话系统按照8000Hz进行语音抽样，每个样值用8位二进制码表示，该系统的编码速率为64kbit/s。

（3）算法复杂度

一般来说，编解码算法复杂度变高，将相应提高音频质量或降低编码速率，但会提高硬件实现的复杂度，增加硬件实现的难度和成本。因此，在实际应用中，一般在保持一定音频质量的前提下尽可能降低算法复杂度。

（4）编解码延时

对音频信号的分帧处理以及复杂的算法会产生编解码延时。其与传输延时构成系统总延时，在实时语音通信系统中，若总延时过长，将会影响双方的正常交谈，因此应尽可能减少延时时间，一般要求音频编解码的延时低于100ms。

2.音频编码的分类

根据编码器的实现机理，可将语音编码大致分为三类：波形编码、参量编码和混合编码。

（1）波形编码

波形编码是从语音信号波形出发，对波形的采样值、预测值或预测误差值进行编码。其以语音信号波形的重建为目的，使重建波形接近原始信号波形。该编码方式重建语音质量好，但编码速率较高。常用的波形编码方法包括脉冲编码调制（PCM）、增量调制（DM）、自适应差分编码调制（ADPCM）、子带编码（SBC）、自适应变换编码（ATC）等。

（2）参量编码

参量编码通过对语音信号某一特征参量的提取及编码，力图重建一个新的与原信号声音相似、但波形不尽相同的语音信号。线性预测编码（LPC）是最常用的语音编码方法，其主要用于移动通信系统等利用无线信道的通信设备中。该方法的优点是可懂度较高，但合成语音自然度不够好，抗背景噪声能力较差。

（3）混合编码

混合编码是在波形和参量编码的基础上提出的，既克服了上述两种编码的弱点，又结合了它们的长处，能在中低速率上实现高质量的重建语音。常用的混合编码包括多脉冲线性预测编码（MP-LPC）、码激励线性预测编码（CELP）等。

3.音频编码的应用

GSM系统最初采用的音频编码算法称为RPE-LPT，即规则脉冲激励线性预测编码；3G WCDMA音频编码算法采用AMR-NB（NB指窄带，即窄带AMR）；4G VoLTE音频编码算法采用AMR-WB（WB指宽带，即宽带AMR）编码方式。

2.2.3 图像编码技术

图像编码是信源编码的一个重要方面，图像编码技术种类很多，数据压缩算法也很多，根据应用的不同产生了不同的编码方法。

与音频编码类似，对图像进行压缩编码之前，首先需要对图像信号进行抽样和量化。与音频信号抽样不同的是，由于静止图像信号是二维的，故通常采用等间隔的点阵抽样方式，即在 x 方向上取 M 点，在 y 方向上取 N 点，读取整个图像函数空间内 M × N 个离散点的值，从而得到一个用样点值所表示的阵列。图像量化的基本要求为在量化噪声足够小的前提下，用最少的量化电平进行量化。

由于图像数据量大、占用频带较宽，得到的各个像素之间不独立，图像信号经过抽样、量化后，得到的数字图像中各个像素彼此之间的相关性很大。例如，在电视画面中，同一行中相邻两个像素或相邻两行间的像素，其相关系数可以达到0.9，而相邻两帧图像的相关性比帧内相关性还要大一些。因此，数字图像中存在信息冗余，进行图像压缩的潜力非常大。

图像压缩编码的核心思想是消除像素间数据的相关性，同时利用人眼的视觉生理特征和图像的概率统计模型进行自适应量化编码。

（1）图像编码的性能指标

图像编码的性能指标主要包括压缩效率（压缩前后编码速率的比值）、压缩质量（指恢复图像的质量）、编解码算法的复杂度、编解码延时等。

（2）图像编码的分类

根据编码过程是否存在信息损耗，图像编码可以分为有损压缩和无损压缩。

根据恢复图像的准确度，图像编码可以分为信息保持编码（主要应用于图像的数字存储，属于无损压缩）、保真度编码（主要应用于数字电视技术和多媒体通信领域，属于有损压缩）、特征提取编码（主要应用于图像识别、分析和分类，属于有损编码）。

根据图像压缩的实现方式，图像编码可以分为变换编码（如离散傅里叶变换）、概率匹配编码（如霍夫曼编码）、预测编码（如DPCM）等。

近年来，图像编码技术取得了迅速的发展和广泛的应用，一些新的压缩方法（如小波编码、分形编码等）不断提出，其考虑了人眼对轮廓、边缘的特殊敏感性和方向感知特性。

在这些编码方法的基础上，目前已经制定了一系列图像编码的国际标准，主要包括：静止图像编码标准，如JPEG和JPEG-2000等；活动图像编码标准，如MPEG-2（一般视频编码标准）、MPEG-4（多媒体通信编码标准）、AVS等；多媒体会议标准，如H.261、H.263等。