购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.2.3 主要率失真模型

率失真理论描述了在给定失真时所需码率的下界,由实际的率失真数据对产生率失真函数需要很大的计算量,所以在实际应用中,大多采用建立率失真模型(Rate-Distortion Model)的方法来简化描述码率和失真的关系。建立的率失真模型与实际率失真函数之间必然存在误差,但由于其形式上的简单性和计算上的低复杂度而在实际编码中被广泛使用。率失真模型在实际中可以根据信源的统计特性和率失真理论来建立,也可以根据经验和回归技术来建立,还要兼顾准确性和复杂度两方面要求。目前,率失真模型种类较多,下面仅简单介绍几种常见的率失真模型。

1.对数模型

考虑到视频编码中引入失真的主要是量化操作,所以率失真 R - D 的关系可以用 R - Q 来替代。还考虑到 R - Q 曲线与服从高斯分布的随机变量的率失真曲线具有一定的相似性,由此得到的简化码率模型为

img

(2.20)

式中, α β 是参数, α 表示的是与量化参数 Q 无直接关系的头信息比特数。这种信源模型没有考虑实际视频编码中采用了Zig-Zag扫描及可变长编码,造成实际码率比随 Q 的增加降低得更快。

2.指数模型

这种模型认为码率与量化参数成一种指数关系:

img

(2.21)

式中, β α γ 是3个控制参数,它们的确定依赖于具体编码图像。对控制参数的准确估计需要对输入序列反复编码,这显然会带来较大的运算复杂度,此时可以根据以前帧的统计特性来获得参数估计,但在场景变换的时候这种估计往往会失效。

3.二次模型

假设信源特性服从Laplacian分布: ,使用的失真度量为 为编码值,可得率失真函数为 ,对其进行二阶Taylor级数展开:

img

(2.22)

简化失真度 D 为量化参数 Q 的平均值,整理后即得二次 R - D 模型:

img

(2.23)

式中, a b 是模型参数,在编码后用线性回归的方法更新。实验证实,如果把对数模型进行更高阶数的Taylor展开,可以得到更准确的率失真模型,但计算复杂度也随之剧增,而且随着阶数增加所获得的准确性增益越来越少。因此,考虑模型准确性和复杂度两方面因素,采取二次的 R - D 模型较为合适。

二次 R - D 模型假设每一个视频帧都有相似的编码复杂度,容易导致目标码率估计不准确;二次模型没有排除非纹理信息所需的比特,如头信息、运动矢量、宏块模式等信息比特。基于这两点考虑,得到了一种改进的二次 R - D 模型:

img

(2.24)

式中, R 是编码当前帧所需的总比特数, H 是编码头信息所需比特,MAD是当前帧的平均绝对残差, Q 是量化参数。此模型被MPEG-4和H.264的码率控制机制采纳并被广泛应用。

4. ρ 域模型

编码视频随着量化步长的增加而变化,量化后DCT交流系数为零的比率 ρ 随之单调变大,量化步长与比率 ρ 之间存在一一对应关系,可将码率和量化步长的关系转化为码率和 ρ 的关系,将失真和量化步长的关系转化为失真和 ρ 的关系。经过理论分析和大量实验,提出了一种基于 ρ 域的线性码率模型和指数形式的失真模型:

img

(2.25)

式中, θ 是常数,使用线性回归方法更新; α 是常数,其值一般为10~20; σ 2 是图像的方差。式(2.25)说明通过中间参数 ρ 可将码率和失真联系在一起。此线性码率模型的形式非常简单,相比传统基于QP的模型也更加准确,尤其适合在场景变换频繁的场合使用。 /2DUWpml/DtMxGi3Pixcn2TpG2YiuWmPtw3WQBNJZA1Z/iaRbREI1hsbdPli4V/6

点击中间区域
呼出菜单
上一章
目录
下一章
×