购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.5.4 基于SSIM的码率控制

由于近年来提出的基于结构相似性(SSIM)的图像质量评价方法与主观质量比较一致,因此如何将其应用于具体的视频编码和码率控制过程引起了国内外学者的广泛关注。

这里介绍一种基于SSIM的H.264的P帧宏块级码率控制方法——SSIM-RC。该方法首先根据实验统计和理论分析确立了SSIM-量化步长( Q step )的线性关系模型,然后结合改进的二次码率-量化模型和拉格朗日优化方法,最终得到SSIM最优的P帧MB层 Q step 的闭式解。

1.SSIM- Q step 的线性模型

由于SSIM计算模型的复杂性,很难用分析法准确得到SSIM失真与码率之间的表达式。通过大量实验统计的方法来确定H.264的P帧SSIM失真与量化步长之间的关系,再结合经典的码率-量化模型得到率失真模型,以此进行准确的码率控制。例如,图2.10显示了Carphone和Foreman两个QCIF序列99个P帧实际编码的亮度平均SSIM值与 Q step 的关系图。图中的9个数据点是实际编码得到,而直线是9个数据点在最小均方准则(LMS)下的线性拟合结果。可见,H.264的P帧编码得到的亮度SSIM值与 Q step 呈现出很明显的线性关系,即随着 Q step 增加,SSIM值线性减小,减小的速率(即斜率)与具体序列的编码特性有关。

定义P帧SSIM- Q step 的线性失真模型如下所示:

img

(2.59)

式中, k b 分别表示拟合直线的斜率和截距。图2.10中的 R 2 为判定系数,其值越大,表示拟合结果越准确。大量实验表明,绝大多数序列SSIM- Q step 线性拟合的 R 2 值都在0.99以上,说明线性拟合结果很准确;而且截距 b 的取值非常接近1,考虑模型的简单性和准确性两方面因素,将截距 b 的取值固定为常数1,而斜率 k 作为变量以适应于不同序列的编码特性。

公式(2.59)具有明确的物理意义:①当 Q step 取H.264允许的最小值0时,P帧编码图像几乎不产生失真,其SSIM值取得最大值1;②当 Q step 变大时,P帧编码图像的SSIM值线性减小,而减小的速率由斜率 k 确定,取决于具体序列的编码特性。

img

图2.10 P帧编码的SSIM- Q step 拟合曲线

2.基于SSIM的 Q step 的最优解

在得到H.264的P帧编码SSIM- Q step 的线性失真模型之后,结合前述的改进二次码率-量化模型,就可得到基于SSIM评价的 Q step 的最优解。

根据式(2.60),定义P帧第 i 个MB的SSIM失真如下:

img

(2.60)

式中,参数 k i 由前一P帧相同位置MB的实际编码结果进行预测,即:

img

(2.61)

式中,SSIM i Q step i 分别为前一P帧相同位置MB编码的实际SSIM值和量化步长。

这样,整帧率失真最优码率控制问题可以表述为在一帧总目标码率 R T 的限制下,通过寻找帧中各MB的最优 Q step 使得整帧的平均SSIM失真最小。参照JVT-O016的式(2.54)的码率-量化模型,建立拉格朗日代价函数如下:

img

(2.62)

最小化代价函数,对各变量求偏导并令其为0,得一方程组,求解方程组可得各MB最优 Q step 的解析式如下:

img

(2.63)

SSIM-RC最优的H.264的P帧MB层码率控制算法是一次编码算法,不需要多次编码,其计算复杂度与JVT-O016相当,只有SSIM值的计算比MSE稍微复杂,可用于实时编码环境。图2.11给出了SSIM-RC算法仿真中Paris序列的实验结果:目标码率为256kb/s时编码的各帧PSNR和SSIM对比图。SIMM-RC算法比JVT-O016在主、客观质量上均有不同程度提高,而相比JVT-G012主、客观质量提高更加明显,码率控制也更准确。

img

图2.11 Paris序列3种算法编码的各帧PSNR和SSIM对比(256kb/s) W4wbQyWsPtqocZ0li0C3yotIicsPrZxe6zJqFVPnyjX0tbWHSDdAGO3dowMimcgG

点击中间区域
呼出菜单
上一章
目录
下一章
×