感知学习视频压缩与循环条件 GAN
本文提出了一种分层学习视频压缩(HLVC)方法,其具有三个分层质量层和一种重复增强网络。我们通过一种图像压缩方法压缩第一层帧,并使用这些帧作为参考来压缩相对高质量的第二层。然后,使用提出的单运动深度压缩(SMDC)网络压缩具有最低质量的第三层。在我们的 HLVC 方法中,分层质量有助于编解码效率,并且最终结果在 PSNR 和 MS-SSIM 方面优于 x265 的 “低延迟 P(LDP)非常快” 模式。
Mar, 2020
本文提出了一种采用循环自编码器(RAE)和循环概率模型(RPM)的递归学习视频压缩(RLVC)方法,以充分利用视频帧之间的时间相关性,实验结果表明,该方法在 PSNR 和 MS-SSIM 方面都达到了最先进的学习视频压缩性能,优于默认的 x265 低延迟 P(LDP)设置和 SSIM-tuned x265 等。
Jun, 2020
通过设计自信度基于的特征重建方法和周期性补偿损失,本文提出了一种新颖的高视觉保真度学习视频压缩框架 (HVFVC),以解决学习视频压缩中的重建问题和优化缺陷,实现了出色的感知质量,并仅需占最新 VVC 标准的 50% 比特率。
Oct, 2023
本研究提出了一种新的基于已有组件的网络结构用于快速学习视频压缩,针对现有方法的图形概率模型进行了分析并指出了实验评估中观察到的时间一致性和颜色偏移的问题,并提出了解决这些问题的方向。
Apr, 2020
本文提出了一种新的端到端学习的视频编码框架,将图像压缩通过条件编码进行泛化,允许处理同一编码器的帧内和帧间信息,并通过最小化速率失真成本进行训练,无需预训练或代理损失,其灵活性在三种编码配置下得到评估(全帧内、低延迟 P 和随机访问),并且表现出与 HEVC 视频编解码器一样具有竞争性的性能。
Apr, 2021
本文提出了 AlphaVC 的压缩算法,采用了几种新的技术来有效地提高压缩性能,包括引入条件 I 帧、像素到特征的运动预测方法和基于概率的熵跳过方法。AlphaVC 在所有常见测试数据集上的 PSNR 和 MSSSIM 指标上均超过了最新的压缩标准 VVC,并且具有非常快的编码和解码速度。
Jul, 2022
本文提出了一种多功能的学习视频压缩(VLVC)框架,使用一种模型支持所有可能的预测模式,包括运动补偿模块和流预测模块,可大大减少体素流的传输成本,并在各种情况下支持多功能压缩。实验结果表明,VLVC 不仅支持多功能压缩,还是首个在 MS-SSIM 方面优于最新 VVC/H.266 标准参考软件的端到端学习视频压缩方法。
Nov, 2021
本文提出了一种基于生成模型的视频压缩表示方法,它可以通过学习紧凑的潜在代码有效地表示和重构视频序列,并且在使用邻节点潜在代码的低秩和相似性约束进行正则化的情况下,可以从不同压缩率下的压缩测量中恢复各种视频信息。
Feb, 2019
我们提出了一种 ML-based 的视频编码算法,通过评估不同分辨率和基于商业编解码器的标准视频压缩测试集发现,在低延迟模式下相对于 HEVC/H.265, AVC/H.264 和 VP9,我们的算法通常产生更小的代码。并且,我们的方法不会出现图块失真和像素化,可以产生更加视觉上令人愉悦的视频。
Nov, 2018