Oct, 2023

多尺度动作感知和时空通道上下文编码网络用于学习视频压缩

TL;DR提出一种基于运动感知、空时域通道上下文编码的视频压缩网络 (MASTC-VC),该网络利用变分自编码器 (VAEs) 学习隐藏表示,捕捉帧内像素和帧间运动的特征,并通过多尺度运动感知模块 (MS-MAM) 和空时域通道上下文模块 (STCCM) 提高编码效率。在三个公共基准数据集上进行的综合实验表明,MASTC-VC 在 PSNR 度量上对 H.265/HEVC (HM-16.20) 平均 BD - 速率有 10.15%的节省,对 H.266/VVC (VTM-13.2) 平均 MS-SSIM 度量上有 23.93%的 BD - 速率节省。