基于深度学习的多用途视频编码中的帧内模式推导
本文提出了一种基于深度神经网络编码的新方法。通过利用多尺度的运动补偿网络进行大范围运动的估计和补偿,同时采用自适应空时上下文模型进行高效熵编码,采用非局部注意力模块进行特征聚合和激活,通过对多模块的优化和多帧训练策略进行时间误差的最小化,最后将其与其他方法进行比较,证明了在流行的测试序列中,在PSNR和MS-SSIM失真度量方面均取得了一致的优异性能。
Jul, 2020
通过基于神经网络的方法来实现速率-失真优化量化(RDOQ), 用于视频压缩标准HEVC中的后量化步骤中,使其在实时硬件编码器中的执行开销降低。该方法在HM 16.20中的实现,比起标量量化方法能够获得更好的性能表现,同时在光度方面实现了1.64% BD-rate的节省,是一个可行的代替RDOQ算法的解决方案。
Dec, 2020
该论文提出了一种面向视觉分析的率失真模型,基于机器学习算法的方法确定了每个编码单元的重要程度,并提出了一种新的失真度量模型以提高图像压缩的品质,从而在多个典型视觉分析任务中实现了高达28.17%的比特率节约。
Apr, 2021
本文提出了一种基于可逆神经网络(INNs)的 Invertible Encoding Network 方法来构建更好的图像空间和潜在特征空间之间的转换,并在 Kodak、CLIC 和 Tecnick 数据集上证明了该方法在高分辨率图像方面优于现有的学习图像压缩方法和压缩标准(包括 VVC (VTM 12.1))的实验结果。
Aug, 2021
本研究提出了一种基于学习的分层双向视频编解码器,结合分层运动预测和端到端优化,实现了目前为止在 PSNR 和 MS-SSIM 上报告的学习视频压缩方案的最佳 R-D 结果,相对于传统视频编解码器,在 PSNR 和 MS-SSIM 以及 HM16.23参考软件的 MS-SSIM 上性能均优于x265和SVT-HEVC编码器的 R-D 性能。
Dec, 2021
本论文提出一种粗到细的(C2F)深度视频压缩框架,通过引入超先验信息和模式预测方法进行更好的运动补偿和压缩编码,实现了超越当前标准(如HEVC,UVG和MCL-JCV)的性能。
Jun, 2022
提出了一种基于卷积神经网络(CNN)的方法,通过预测VVC中的最佳分区路径来加速分区过程。在实验中,该方法在BD-rate方面取得了0.44%至4.59%的效率损失范围内,同时加速范围从16.5%到60.2%,超过了其他最先进的解决方案,并且是该领域中最轻量级的方法之一。
Oct, 2023
本文提出了一种基于卷积神经网络(CNN)的方法来加速VVC中的分区,该方法在编码树单元(CTU)级别操作,将每个CTU分割成8x8个固定网格块,每个网格中的单元格与该区域内的分区深度相关联,带有轻量级的网络用于预测此网格,通过限制四进制树(QT)分割搜索并避免不太可能选中的分区来达到加速的效果。实验证明,该方法在VVC Test Model (VTM)10的RandomAccess Group Of Picture 32(RAGOP32)模式中,可以实现从17%到30%的加速,以及以0.37%到1.18%的BD率增加的合理效率下降。
Dec, 2023