基于小波域的DVC到HEVC快速转码研究

2017-04-18 16:01徐胤颢卿粼波吴晓红刘晓娟
软件导刊 2017年2期
关键词:转码

徐胤颢+卿粼波+吴晓红+刘晓娟

摘要 分布式视频编码是一种编码端复杂度低、解码端复杂度高的新型视频编码技术,HEVC则是编码端复杂度高、解码端复杂度低的新一代视频编码标准。通过视频转码技术将分布式视频编码和HEVC中高复杂度的运算转移到转码器,可实现一种编、解码都简单的视频编码框架。同时,针对在转码过程中需要对重建的视频帧进行HEVC重编码,提出利用分布式视频的关键帧解码生成WZ帧的编码单元四叉树划分,以降低分布式视频编码到HEVC转码的复杂度。实验结果表明,该转码方案与级联转码方案相比,在几乎不降低视频质量的前提下,极大地降低了转码计算复杂度和时间,提高了转码效率。

关键词 小波域;转码;分布式视频编码;HEVC

DOI DOI: 10.11907/rjdk.162729

中图分类号: TP301

文献标识码: A 文章编号 文章编号: 16727800(2017)002000103

0 引言

伴隨着多媒体技术的日益完善与广泛应用,数字视频技术诞生了多种视频编码技术,例如H.26x系列、MPEG、JPEG2000和分布式视频编码(Distributed Video Coding,DVC)技术等。由于不同视频编码技术之间存在视频帧率、视频码率和视频分辨率等不兼容问题,极大地阻碍了多媒体视频通信的普及与应用。可以预见视频转码技术在多媒体视频通信时代担任的角色将越来越重要。视频转码技术是一种解决视频编码端与视频解码端不匹配问题的技术,通过视频转码技术可以实现不同的视频标准、视频分辨率、视频帧率和视频码率等之间的相互转换。视频转码器可以划分为两大类:同构转码器和异构转码器。同构转码器指在同样编码标准下的码流转换,可实现视频分辨率、视频帧率和视频码率相互转换;而异构转码器是不同类别压缩视频流之间的转换,如MPEG2到H.264、MPEG4到H.264和本文的分布视频编码到HEVC等。分布式视频编码是一种以SlePianWolf(1973)[1]的无损分布式编码理论和WynerZiv(1976)[2]的有损分布式编码理论为基础的新型视频编码技术。分布式视频编码技术通过将系统中高复杂度的运动估计与运动补偿从编码端转移到解码端,实现了其编码端简单、解码端复杂的特点。因此,分布式视频编码技术适用于编码端计算能力受限、功耗受限和内存受限的应用场合,例如无线视频监控和无人机航拍领域。

由于DVC具有编码端复杂度低的特点,国内外学者对有效地将DVC技术与传统视频编码标准结合起来的转码技术进行了深入研究。吴伟[3]介绍了分布式到H.264转码过程中复杂度高和时延长等问题,以及利用 DVC解码端生成的运动矢量可降低转码的计算复杂度和时间,提高转码效率;孙思阳等[4]对分布式视频编码技术的理论基础以及分布式视频编码过程中的关键技术进行了阐述,并详细介绍了从DVC到H.264的转码技术中各个模块的实现细节。随着新一代视频编码标准的发布,HEVC的出现标志着视频压缩编码技术进入了新时代。HEVC作为H.264标准的继承者,与H.264相比,HEVC可以在同等的视频质量下节省约50%的比特率[5],但是HEVC以增加其编码端复杂度的代价获得高压缩率。自从新一代视频编码标准发布后,国内外学者开始对其它视频编码转码到HEVC进行了研究。蒋炜等[6]提出了一种基于区域特征分析的H.264到HEVC快速视频转码方法。以上参考文献对DVC到H.264与H.264到HEVC的理论基础以及关键技术进行了详细阐述,但针对DVC到HEVC转码技术的相关研究仍然较少,因此本文提出基于小波域的分布式视频编码到HEVC快速转码技术研究。通过本文的视频转码技术,可以充分利用分布式视频编码与HEVC的优点,实现编码端与解码端的低复杂度,并将分布式视频编码与HEVC高复杂度的运算转移到转码服务器。

1 DVC到HEVC快速转码框架

分布式视频是一种新兴的视频编码技术, 它具有编码端复杂度低、压缩效率高和鲁棒性高的优点。而HEVC是新一代的视频编码标准,它具有码端复杂度极高、解码端复杂度低、压缩效率极高等特点。DVC到HEVC的转码技术可以充分利用分布式视频编码和HEVC的优势,使DVC到HEVC的视频转码具有编码端与解码端复杂度低、压缩效率高的特点。

1.1 HEVC四叉树划分复杂度分析

HEVC采用基于递归调用的四叉树划分方式,提高了其图像分块的灵活度和压缩性能[7]。然而,该划分方式极大地增加了HEVC编码端复杂度。在HEVC中,CU的划分尺寸有64×64、32×32、16×16和8×8共4种。一个CTU的四叉树划分过程如下:首先计算尺寸为64×64的CU率失真代价以及其PU的最佳预测模式;再将64×64的CU划分成4个尺寸为32×32的CU,并计算每个CU的率失真代价以及最佳预测模式;采用相同的划分方式再将32×32的CU划分为16×16和8×8的CU,并计算相应的率失真代价和PU最佳预测模式;最后,从8×8的CU到64×64的CU逐级往上比较其率失真代价,保留最小率失真代价的CU划分模式。其详细划分过程如图1所示。

在帧间编码模式下,确定一个CTU递归划分方式以及每个CU对应的PU预测模式需要计算的率失真代价次数高达680次,而对于分辨率为720P的视频序列,一幅图片需要计算的率失真代价高达6.364 8*104次。在HEVC编码端,CTU的递归划分方式的计算量占整个编码端计算量的90%以上,其中CU64、CU32、CU16和CU8在CTU各层次划分的时间开销所占百分比分别为16%、23%、30%和31%[8]。因此,本文针对HEVC编码算法中CTU四叉树划分高复杂度的特性,提出在转码过程中,充分利用分布式解码的码流信息来加速HEVC重编码过程中CTU的四叉树划分,以提高转码器性能。

1.2 基于帧间预测的DVC-HEVC转码

由于在HEVC視频编码中,I帧和P帧的CU划分都是采用递归调用的四叉树划分方式,根据帧间相关性,同一图像组内的I帧与P帧的CU划分模式存在相似之处,不同之处在于其PU的划分方式。当QP分别为18、22、26时,本文对BasketballDrill与BQMall两种视频序列,分别在帧内编码和帧间编码编码模式下,对其CU的划分深度进行统计分析。首先提取帧内与帧间编码后的CU划分方式,再将100帧图像中所有的CU分割为4×4的块,然后对100帧中每个块对应的帧内与帧间的CU划分深度进行统计,统计结果如表1所示。表1的实验数据说明,帧内CU划分深度大于等于帧间CU划分深度的比例高达90%以上,而分布式视频编码的关键帧可以采用HEVC帧内编码方式。因此,本文基于分布式视频编码的特点以及视频序列的帧间相关性提出了小波域分布式视频编码到HEVC快速转码的系统,其转码框图如图2所示。

如图2所示,在分布式视频编码端,由视频分类器将视频序列按一定间隔,交替划分为关键帧(K帧)和Wyner-Ziv帧(WZ帧)。其中关键帧K帧采用HEVC帧内编码方式生成HEVC关键帧码流,再将关键帧码流传输到转码器。WZ帧采用Wyner-Ziv编码模式[910]生成WZ帧码流,再将WZ帧码流经反馈信道传输到转码器。

在转码器接收到WZ帧码流和HEVC关键帧码流之后,首先将HEVC关键帧进行帧内解码,并在解码的同时提取关键帧的CU划分方式;将HEVC解码器解码重建的视频图像经小波变换、运动估计和运动补偿后生成WZ帧的边信息,将边信息经过信道译码后,进行反量化和离散小波逆变换,重建WZ帧[11];然后用DVC中关键帧CU划分方式对重建WZ进行CU的划分,并判断当前CU的预测单元PU的最佳预测模式,将WZ帧的CU划分深度以及PU预测模式输入到HEVC编码器中;由于HEVC编码器已经得到当前WZ帧的CU划分深度以及其PU预测模式,HEVC编码器可以快速地进行HEVC视频编码并产生HEVC码流。

2 实验结果与分析

实验以BasketballDrill、BQMall视频序列为例,验证提出的小波域分布视频编码到HEVC快速转码的有效性。本次实验将本文提出的小波域DVC到HEVC快速转码与小波域DVC到HEVC级联转码的转码性能进行对比。实验视频序列的视频格式为420P,测试帧数为100帧,帧率为30Hz,量化步长分别为18、22、26。为了测试本文提出的小波域分布式视频编码到HEVC转码的性能,本文分别对转码时间比和峰值信噪比进行数据统计,其结果分别如表2、表3所示。

式(1)中,ΔPSNR表示本文转码方案与级联转码方案在转码后视频的峰值信噪比对比情况,ΔPSNR越小,表明按本文方案对视频转码后,视频质量越差。式(2)中T表示DVC到HEVC转码需要的时间,ΔT表示本文转码方案在级联转码方案节省的时间占整个级联转码所需时间的百分比,负百分比的绝对值越大,表明本文提出的转码方案节省时间越多。

表2表示本文小波域分布式视频到HEVC的快速转码方案与小波域分布式视频编码到HEVC级联转码的转码时间对比情况。对于BasketballDril序列,当Qp值分别为18、22、26时,其△T分别为-40.61%、-41.15%、-56.75%;对于BQMall序列,当Qp值分别为18、22、26时,其分别为-66.15%、-68.14%、-68.55%。结果表明,本文提出的小波域DVC到HEVC的分布式转码算法和级联转码算法相比,本文提出的转码算法极大地降低了转码时间。

表3表示本文小波域分布式视频到HEVC的快速转码方案与小波域分布式视频编码到HEVC级联转码峰值信噪比的对比情况。对于BasketballDril序列,当Qp值分别为18、22、26时,其△PSNR分别为-0.05dB、-0.07dB、-0.07dB;对于BQMall序列,当Qp值分别为18、22、26时,其△PSNR分别为-0.17dB、-0.05dB、-0.04dB。本文提出的快速转码方案与级联转码相比,本文方案的峰值信噪比平均下降了0.075dB。实验结果表明,本文提出的小波域DVC到HEVC的快速转码算法几乎不降低视频质量。

3 结语

分布式视频编码是一种编码端简单、解码端复杂的新型视频编码技术,而HEVC则是一种编码端复杂、解码端简单的新一代视频编码技术。通过DVC到HEVC的转码器把复杂度最高的计算转移到转码器,可以实现一种编码端与解码端都简单的视频编码技术。本文针对HEVC视频码中,CU的递归划分方式占整个编码端计算量的90%以上,提出利用分布式视频编码中关键帧的CU信息,在转码器中对WZ帧进行四叉树划分,并生成相应CU的预测模式,从而避免了CU基于四叉树的递归划分,极大地降低了转码器复杂度。本文从转码时间和转码后的峰值信噪比方面对本文的小波域DVC到HEVC快速转码和小波域DVC到HEVC的级联转码进行了对比。实验结果证明,本文提出的快速转码方案在几乎不降低转码后视频质量的前提下,能平均降低约56.89%的转码时间。

参考文献 参考文献:

[1] SLEPIAN,DAVID,J K WOLF.Noiseless coding of correlated information sources[J].IEEE Transactions on Information Theory ,1973,19(4):471480.

[2] WOLFFOWITZ J.The rate distortion function for source coding with side information at the decoder.II[J].Probability Theory & Related Fields,1978,50(3):245255.

[3] 吴伟,卿粼波,王正勇,等.DVC转码技术研究[J].电视技术,2015(19):7177.

[4] 孙思阳.DVC分布式视频编码到H.264的转码实现[D].北京:北京邮电大学,2011.

[5] WANG J,ZHOU L,SUN T.Analysis of HEVC coding standard[J].International Journal of Hybrid Information Technology,2015:116.

[6] 蒋炜.H.264到HEVC视频转码技术研究[D].杭州:浙江大学,2013.

猜你喜欢
转码
天津台新闻云系统外来视频文件转码方案
视频转码技术在广播电视中的应用研究
基于Spark Streaming的快速视频转码方法
基于Hadoop的流媒体转码系统设计
视频转码软件的需求和框架分析
基于IPTV点播业务的视频分段式转码方案的研究与应用
数字视频转码失真分析
基于Hadoop 的分布式视频转码方案
实时转码云平台技术及其在SoLoMo模式中的应用
基于GMM 的AMR-NB 与G.729A 之间的LSP 参数转码方法