视频编码与传输新技术最新章节_朱秀昌著

1.3.2　MPEG-x标准

1．MPEG-1标准

MPEG-1是1992年ISO活动图像专家组（MPEG）制定的第一个活动图像及其伴音的压缩、解压缩及编码描述的国际标准——“高于1.5Mb/s数字存储媒体上的活动图像及其伴音的编码（ISO/IEC11172）”。MPEG-1主要包括系统、视频、音频、一致性、参考软件等5部分，这里仅简要介绍视频部分。

MPEG-1的目的是满足各种存储媒体对压缩视频的统一格式的需要，可用于对普通视频进行压缩处理，以1.5Mb/s左右的码率提供连续的、活动图像的编码表示，最普及的应用如VCD、视频会议、视频监控、计算机存储等。

MPEG-1的压缩原理、系统构成和主要技术基本上和H.261相差无几，不同之处在于引入了4种编码帧：I帧、P帧、B帧和D帧。其中I帧和P帧相当于H.261中的帧内编码帧和帧间预测帧。B帧是双向预测帧，能提供最大限度的压缩，它需要过去和将来的参考帧（I帧或P帧）进行双向运动估计和补偿，但它本身不能用作预测参考帧。D帧为仅含DCT的直流分量，用它可提供一种简单而具有一定质量的快进模式。

2．MPEG-2标准

MPEG-2标准是MPEG于1995年推出的第二个国际标准——“通用的活动图像及其伴音的编码（ISO/IEC 13818）”。它主要包括系统、视频、音频、一致性、参考软件、数字存储媒体的命令与控制（DSM-CC）、高级音频编码、10bit视频编码、实时接口和DSM-CC的一致性等10个部分。

对于视频部分，它和ITU-T的H.262标准等同，作为一个通用的编码标准，它的应用范围更广，如标准数字电视（SDTV）和高清晰度电视（HDTV）等。MPEG-2包括了MPEG-1的工作范围，使MPEG-1实际上成为它的一个子集，即MPEG-2的解码器可以对MPEG-1的码流进行解码。MPEG-2的主要改进之处在于：

（1）区分视频场和帧。在MPEG-2中，为了更好地适应隔行扫描视频信号的特点，在DCT、预测和运动估计算法中对帧和场进行了不同的处理。

（2）编码的可分级性。为了扩大应用范围并增强对各种信道的适应性，MPEG-2引入了三种编码的可分级性，即空间可分级性、时间可分级性及信噪比（SNR）可分级性编码。

3．MPEG-4标准

MPEG-4（ISO/IEC 14496）是MPEG 于1999年颁布的一个适应各种多媒体应用的标准——“视听对象的编码”。它主要包括系统、视觉信息、音频、一致性、参考软件、多媒体传送集成框架、优化软件、IP中的一致性、参考硬件描述和AVC等10部分。和MPEG-1、MPEG-2不同，MPEG-4不仅着眼于定义不同码流下具体的压缩编码标准，更多地强调多媒体通信的灵活性和交互性，形成了MPEG-4最为突出几个概念。

1）自然视频的编码

MPEG-4同时支持自然和合成可视信息（如图形、计算机动画等）的编码。对于自然视频的编码，MPEG-4仍然采用预测、变换同时使用的混合编码框架。在此基础上还提供一些高层次的编码方法，如基于内容的编码，允许对任意形状视频对象进行的编码。

2）基于对象的编码

MPEG-4的编码是基于对象（Object Based）的编码方式，不同的对象可以采用不同的编码工具。在MPEG-4中任何一个场景被理解为若干视频对象（Video Object，VO）的组成。它们是一个矩形的视频帧或其中的一部分。在某个时刻的VO被称为VOP（Video Object Plane）。各VOP的空间和时间上的关系用结构文本来描述。图1.12（a）是一个简单场景的例子，它包括三个对象：VOP ₀ （背景）、VOP ₁ （树）、VOP ₂ （人）。图（b）是三个对象在场景中组成的逻辑关系。根据需要，一个VO还可作进一步分解，如图中VOP ₁ 可以分成树冠和树干等。

图1.12　MPEG-4的场景结构

3）编码工具集

MPEG-4为视听信息编码提供了一个包含多种工具和多种算法的工具集，对各种应用提供不同的解决方法，供用户选择。工具集可以不断地扩充进新的编码工具，甚至用户自己的编码方法也可放入工具集。这样，使得标准可随时赶上技术的发展并保持长时间有效。

4）场景描述

MPEG-4规定了各种音视频对象的编码，除了包括自然的音视频对象以外，还包括图像、文字、2D和3D图形及合成话音和音乐等。MPEG-4通过场景描述（Scene Description）信息，即各种对象的空间位置和时间关系等，建立一个多媒体场景，并将它与编码的对象一起传输。由于对各个对象进行独立的编码，可以达到很高的压缩效率，同时也为在接收端根据需要对内容进行操作提供了可能，因此适应多媒体应用中的人机交互的要求。

4．MPEG-RVC标准

在2006年ISO/MPEG正式确定了MPEG可重定义视频编码（Reconfigurable Video Coding，RVC）标准的制定工作，并对其进行了结构说明和需求分析。随后在2008年分布了RVC白皮书，2009年颁布了RVC 标准第1版，2011年正式颁布RVC。

MPEG-RVC旨在制定规范化的视频标准，模块化的编解码工具，可针对不同视频应用领域（如数字电视、IPTV、DVD、卫星电视、手机电视、网络流媒体等）和不同的环境提供可配置的视频编解码方案；建立基于MPEG标准的编解码工具集的共享机制，促进MPEG多媒体中间件的发展，提供多种基于编码器的硬件描述方式，并能实现对非MPEG系列标准的支持。

MPEG-RVC标准主要包括两部分：第一部分提供具有标准接口的视频编码工具，定义它们为功能单元（Functional Units，FUS）。第二部分建立机器可读的解码器描述机制。在合理划分功能模块的基础上，可实现对现有MPEG系列编解码标准的技术分解，按照最小公约数理论将各标准逐一分类，组成编解码工具集。

一个典型的MPEG-RVC视频编解码流程如图1.13所示，可简单理解为在全局控制单元（Global Control Unit，GCU）控制下的模块化功能单元的联合工作结果，具体步骤如下。

（1）发送端：根据具体视频编/解码要求，运用基于编码工具集的视频编码技术设计编码器；运用标准视频解码技术设计出相应解码器；建立标准的解码器描述。

（2）传输通道：将解码器描述发送给接收器。

（3）接收端：根据收到的解码器描述，在本地视频编/解码工具中选择相应的功能单元（FUS）配置解码器；建立解码程序算法；生成全局控制单元（GCU）；建立GCU和FUS的联系。

（4）编码器开始实际传输编码视频流。

（5）解码器开始解码。

图1.13　RVC编/解码应用流程

MPEG-RVC标准框架的提出，可消除各种视频编码标准之间的格式壁垒，有望通过对统一的编/解码工具集中不同功能单元的组合，实现对MPEG系列及非MPEG系列视频标准的编/解码应用，提供统一的视频编/解码技术平台，降低新技术研发成本，简化设备复杂度，消除因标准不同而导致的视频编/解码的不可兼容性，提高新一代视频标准的推广速度，更好地适应当前市场发展需要。

1.3.2 MPEG-x标准

1.3.2　MPEG-x标准