基于H.265视频压缩标准的搜索算法改进文献综述

 2023-08-15 17:09:37

文献综述(或调研报告):

2010年4月,VCEG 和 MPEG 再次组建视频编码联合组(Joint Collaborative Team on Video Coding, JCT-VC),联手制定新一代视频编码标准—H.265/HEVC。JCT-VC的主要目标是在上一代视频编码器 H.264/AVC的基础上,使视频编码率提高到一倍以上。在编码率提高的同时,允许编码端的复杂度在允许范围内有所提高。2013年6月,ITU-T网站上正式发布了H.265/HEVC 标准。2013 年 11 月 25 日,ISO/IEC 正式发布了 H.265/HEVC 标准。与H.264/AVC相比,HEVC以高达2-10倍的计算复杂度为代价,实现了编码性能的显著提高。计算成本的提高使得HEVC很难应用到实时系统中[1]。

在HEVC使用的所有编码技术中,帧间编码中的运动估计(ME)和运动补偿(MEC)是视频压缩算法中的最重要的部分之一。主要用于寻找参考帧中的最佳匹配块,以减少连续帧之间的时间冗余。使用帧间编码之后,在视频的传输和存储过程中仅需要考虑运动向量(MV)和残差,大幅度提高了视频压缩的效率。但运动估计也是HEVC编码中最耗时的模块之一,因此各个文献中已经开发了许多快速的运动估计算法来降低运动估计的计算复杂度,从而降低了视频编解码器的复杂度[2][3]。

最早应用于运动估计的搜索算法是全搜索算法(FS)。该算法通过遍历搜索窗口中的所有位置,计算出所有像素点中最小的速率失真成本,从而获得最佳匹配块。尽管全搜索算法在各种运动估计算法中提供了最好的质量,但是它的计算复杂度很高,可能占总编码时间的40-80%。为了在编码性能和计算复杂度之间取得平衡,在HEVC测试模型(HM)中,测试区域搜索(TZS)被实现为内置的快速搜索机制(FSM)[4]。该算法与全搜索算法的主要差别在于在搜索过程中实行菱形或正方形图形搜索。TZSearch作为HEVC标准的默认快速整数像素运动估计算法,与全搜索算法相比,其编码速度提高了近100倍[5]。但尽管如此,过高的计算成本仍然是HEVC应用到实时系统的难点。近年来,降低整数像素运动估计的计算复杂度已成为研究热点。根据侧重点的不同,研究可以大致分为三类,即搜索模式设计,搜索窗口决策和提前终止策略[6]。

A.搜索模式设计算法

在许多快速块匹配算法中已经设计了不同的搜索模式,例如,三步搜索(TSS),四步搜索(FSS),菱形搜索(DS),六边形搜索(HEXBS),非对称交叉多六角形搜索(UMHexagonS)[7]等。这些搜索模式可以大大降低整数像素运动估计的计算复杂度,但存在局部最优解的问题。

为了进一步优化快速搜索算法,减少局部最优解,[8]和[9]分别提出了五边形图案和旋转五边形图案。另一方面,[10]提出了一种具有正方形模式的方向搜索算法。

除去具有普适性的算法优化之外,针对视频中不同区域具有不同的运动特性的特点,搜索算法还需要针对不同运动特性分配相应的计算成本以确保视频编码和恢复的质量。如果对复杂程度不同的运动区域使用相同的搜索模式,可能很难在性能和编码效率之间取得平衡。为解决这一问题,[11]提出了基于运动分类的搜索模式算法。通过探索相邻块的运动关系和编码成本特征,将预测单元(PU)分为三类,即平滑运动类,介质运动类和复杂运动类。然后,根据每个类别各自的运动和内容特征,精心设计不同的搜索策略。实验结果表明,基于运动分类的搜索模式设计算法在编码性能和降低复杂度方面均优于最新的快速运动估计算法。

B.搜索窗口决策算法

该类别中的算法集中于通过动态调整搜索窗口尺寸,减少搜索点的数量,从而降低整体编码的计算复杂度。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版