使用预测运动矢量的优化性质的一维 HEVC 视频隐写分析方法
该研究引入了一种端到端可训练的双流视频预测框架 —— 基于运动矩阵的视频预测(MMVP),旨在应对视频预测中对象未来运动的推理问题并保持其在帧之间的一致性。通过构建与外观无关的运动矩阵,MMVP 将运动和外观信息分离,从而提高了视频预测的准确性和效率,并减小了模型尺寸。大量实验证明,MMVP 在公共数据集上以小得多的模型尺寸(84% 或更小)显著优于现有系统(PSNR 上大约提高了 1db,UCF Sports)。
Aug, 2023
提出一种基于运动感知、空时域通道上下文编码的视频压缩网络 (MASTC-VC),该网络利用变分自编码器 (VAEs) 学习隐藏表示,捕捉帧内像素和帧间运动的特征,并通过多尺度运动感知模块 (MS-MAM) 和空时域通道上下文模块 (STCCM) 提高编码效率。在三个公共基准数据集上进行的综合实验表明,MASTC-VC 在 PSNR 度量上对 H.265/HEVC (HM-16.20) 平均 BD - 速率有 10.15%的节省,对 H.266/VVC (VTM-13.2) 平均 MS-SSIM 度量上有 23.93%的 BD - 速率节省。
Oct, 2023
本研究提出了多模式视频压缩(MMVC)框架,通过深度学习和区块式模式集成选择最佳模式来适应各种动作模式和熵模型,包括 ConvLSTM,光流条件化特征域预测和特征传播,通过对空间块进行时间预测,以最大程度地减少数据的冗余和失真。实验表明,与最先进的视频压缩方案和标准编解码器相比,本方法在 PSNR 和 MS-SSIM 度量方面获得了更好或具有竞争力的结果。
Apr, 2023
使用运动矢量来提高压缩视频的光流估计的速度和准确性,构建了四个包含帧和运动矢量的压缩视频光流数据集,实验证明 MVFlow 相对现有模型减少 1.09 AEPE 或节省 52% 时间来达到类似准确性。
Aug, 2023
本文提出了 AlphaVC 的压缩算法,采用了几种新的技术来有效地提高压缩性能,包括引入条件 I 帧、像素到特征的运动预测方法和基于概率的熵跳过方法。AlphaVC 在所有常见测试数据集上的 PSNR 和 MSSSIM 指标上均超过了最新的压缩标准 VVC,并且具有非常快的编码和解码速度。
Jul, 2022
该研究提出了一种端到端的学习视频压缩方案,使用多个参考帧来提高数据压缩效率,其中包括运动向量 (MV) 场的计算、残差和 MV 的深度自编码压缩,以及一个利用多个参考帧的 MV 细化网络和残差细化网络。
Apr, 2020
该论文提出了一种面向视觉分析的率失真模型,基于机器学习算法的方法确定了每个编码单元的重要程度,并提出了一种新的失真度量模型以提高图像压缩的品质,从而在多个典型视觉分析任务中实现了高达 28.17% 的比特率节约。
Apr, 2021
提出了一种基于卷积神经网络(CNN)的方法,通过预测 VVC 中的最佳分区路径来加速分区过程。在实验中,该方法在 BD-rate 方面取得了 0.44%至 4.59%的效率损失范围内,同时加速范围从 16.5%到 60.2%,超过了其他最先进的解决方案,并且是该领域中最轻量级的方法之一。
Oct, 2023
通过使用先进技术对参考帧中的对象进行分割并将分割结果作为不同区域的任意形状分区,我们提出了一种对象分割辅助的帧间预测方法。通过该方法,可以实现更高的预测准确性和更高效的运动向量编码,同时在运动估计和分区估计的联合率失真优化中考虑分割结果,从而更准确地得出了不同区域的运动向量和分区。在实验中,我们发现该方法在常见测试序列中可以分别达到 1.98%,1.14%和 0.79%的 BD 速率降低,对应平均的 BD 速率降低率分别为 0.82%,0.49%和 0.37%,在低延迟 P、低延迟 B 和随机存取配置下。
Mar, 2024
本文提出了一种有效地利用现代视频压缩技术的运动矢量和残余的方法来学习原始帧的表征,并大大减少时域冗余,从而提高视频处理模型的速度。通过用优化的方法去除不可靠的运动信息,我们取得了与 CoViAR 同样好的结果。
Oct, 2019