购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3.2 MPEG-x标准

1.MPEG-1标准

MPEG-1是1992年ISO活动图像专家组(MPEG)制定的第一个活动图像及其伴音的压缩、解压缩及编码描述的国际标准——“高于1.5Mb/s数字存储媒体上的活动图像及其伴音的编码(ISO/IEC11172)”。MPEG-1主要包括系统、视频、音频、一致性、参考软件等5部分,这里仅简要介绍视频部分。

MPEG-1的目的是满足各种存储媒体对压缩视频的统一格式的需要,可用于对普通视频进行压缩处理,以1.5Mb/s左右的码率提供连续的、活动图像的编码表示,最普及的应用如VCD、视频会议、视频监控、计算机存储等。

MPEG-1的压缩原理、系统构成和主要技术基本上和H.261相差无几,不同之处在于引入了4种编码帧:I帧、P帧、B帧和D帧。其中I帧和P帧相当于H.261中的帧内编码帧和帧间预测帧。B帧是双向预测帧,能提供最大限度的压缩,它需要过去和将来的参考帧(I帧或P帧)进行双向运动估计和补偿,但它本身不能用作预测参考帧。D帧为仅含DCT的直流分量,用它可提供一种简单而具有一定质量的快进模式。

2.MPEG-2标准

MPEG-2标准是MPEG于1995年推出的第二个国际标准——“通用的活动图像及其伴音的编码(ISO/IEC 13818)”。它主要包括系统、视频、音频、一致性、参考软件、数字存储媒体的命令与控制(DSM-CC)、高级音频编码、10bit视频编码、实时接口和DSM-CC的一致性等10个部分。

对于视频部分,它和ITU-T的H.262标准等同,作为一个通用的编码标准,它的应用范围更广,如标准数字电视(SDTV)和高清晰度电视(HDTV)等。MPEG-2包括了MPEG-1的工作范围,使MPEG-1实际上成为它的一个子集,即MPEG-2的解码器可以对MPEG-1的码流进行解码。MPEG-2的主要改进之处在于:

(1)区分视频场和帧。在MPEG-2中,为了更好地适应隔行扫描视频信号的特点,在DCT、预测和运动估计算法中对帧和场进行了不同的处理。

(2)编码的可分级性。为了扩大应用范围并增强对各种信道的适应性,MPEG-2引入了三种编码的可分级性,即空间可分级性、时间可分级性及信噪比(SNR)可分级性编码。

3.MPEG-4标准

MPEG-4(ISO/IEC 14496)是MPEG 于1999年颁布的一个适应各种多媒体应用的标准——“视听对象的编码”。它主要包括系统、视觉信息、音频、一致性、参考软件、多媒体传送集成框架、优化软件、IP中的一致性、参考硬件描述和AVC等10部分。和MPEG-1、MPEG-2不同,MPEG-4不仅着眼于定义不同码流下具体的压缩编码标准,更多地强调多媒体通信的灵活性和交互性,形成了MPEG-4最为突出几个概念。

1)自然视频的编码

MPEG-4同时支持自然和合成可视信息(如图形、计算机动画等)的编码。对于自然视频的编码,MPEG-4仍然采用预测、变换同时使用的混合编码框架。在此基础上还提供一些高层次的编码方法,如基于内容的编码,允许对任意形状视频对象进行的编码。

2)基于对象的编码

MPEG-4的编码是基于对象(Object Based)的编码方式,不同的对象可以采用不同的编码工具。在MPEG-4中任何一个场景被理解为若干视频对象(Video Object,VO)的组成。它们是一个矩形的视频帧或其中的一部分。在某个时刻的VO被称为VOP(Video Object Plane)。各VOP的空间和时间上的关系用结构文本来描述。图1.12(a)是一个简单场景的例子,它包括三个对象:VOP 0 (背景)、VOP 1 (树)、VOP 2 (人)。图(b)是三个对象在场景中组成的逻辑关系。根据需要,一个VO还可作进一步分解,如图中VOP 1 可以分成树冠和树干等。

img

图1.12 MPEG-4的场景结构

3)编码工具集

MPEG-4为视听信息编码提供了一个包含多种工具和多种算法的工具集,对各种应用提供不同的解决方法,供用户选择。工具集可以不断地扩充进新的编码工具,甚至用户自己的编码方法也可放入工具集。这样,使得标准可随时赶上技术的发展并保持长时间有效。

4)场景描述

MPEG-4规定了各种音视频对象的编码,除了包括自然的音视频对象以外,还包括图像、文字、2D和3D图形及合成话音和音乐等。MPEG-4通过场景描述(Scene Description)信息,即各种对象的空间位置和时间关系等,建立一个多媒体场景,并将它与编码的对象一起传输。由于对各个对象进行独立的编码,可以达到很高的压缩效率,同时也为在接收端根据需要对内容进行操作提供了可能,因此适应多媒体应用中的人机交互的要求。

4.MPEG-RVC标准

在2006年ISO/MPEG正式确定了MPEG可重定义视频编码(Reconfigurable Video Coding,RVC)标准的制定工作,并对其进行了结构说明和需求分析。随后在2008年分布了RVC白皮书,2009年颁布了RVC 标准第1版,2011年正式颁布RVC。

MPEG-RVC旨在制定规范化的视频标准,模块化的编解码工具,可针对不同视频应用领域(如数字电视、IPTV、DVD、卫星电视、手机电视、网络流媒体等)和不同的环境提供可配置的视频编解码方案;建立基于MPEG标准的编解码工具集的共享机制,促进MPEG多媒体中间件的发展,提供多种基于编码器的硬件描述方式,并能实现对非MPEG系列标准的支持。

MPEG-RVC标准主要包括两部分:第一部分提供具有标准接口的视频编码工具,定义它们为功能单元(Functional Units,FUS)。第二部分建立机器可读的解码器描述机制。在合理划分功能模块的基础上,可实现对现有MPEG系列编解码标准的技术分解,按照最小公约数理论将各标准逐一分类,组成编解码工具集。

一个典型的MPEG-RVC视频编解码流程如图1.13所示,可简单理解为在全局控制单元(Global Control Unit,GCU)控制下的模块化功能单元的联合工作结果,具体步骤如下。

(1)发送端:根据具体视频编/解码要求,运用基于编码工具集的视频编码技术设计编码器;运用标准视频解码技术设计出相应解码器;建立标准的解码器描述。

(2)传输通道:将解码器描述发送给接收器。

(3)接收端:根据收到的解码器描述,在本地视频编/解码工具中选择相应的功能单元(FUS)配置解码器;建立解码程序算法;生成全局控制单元(GCU);建立GCU和FUS的联系。

(4)编码器开始实际传输编码视频流。

(5)解码器开始解码。

img

图1.13 RVC编/解码应用流程

MPEG-RVC标准框架的提出,可消除各种视频编码标准之间的格式壁垒,有望通过对统一的编/解码工具集中不同功能单元的组合,实现对MPEG系列及非MPEG系列视频标准的编/解码应用,提供统一的视频编/解码技术平台,降低新技术研发成本,简化设备复杂度,消除因标准不同而导致的视频编/解码的不可兼容性,提高新一代视频标准的推广速度,更好地适应当前市场发展需要。 nImhV+rZkDWcw43j2iehqYS5FTZlCGIQJ1GCfgNbsWVXDfUai3jZzSD7p9eLIQ84

点击中间区域
呼出菜单
上一章
目录
下一章
×