高视觉保真度学习视频压缩
本文提出了 AlphaVC 的压缩算法,采用了几种新的技术来有效地提高压缩性能,包括引入条件 I 帧、像素到特征的运动预测方法和基于概率的熵跳过方法。AlphaVC 在所有常见测试数据集上的 PSNR 和 MSSSIM 指标上均超过了最新的压缩标准 VVC,并且具有非常快的编码和解码速度。
Jul, 2022
本文介绍了大规模压缩人脸视频质量评估数据库的构建和性能评估,该数据库被认为是系统地理解人脸视频中感知质量和多样化压缩畸变的第一次尝试,同时还开发了 FAVOR 指数来度量人脸视频的感知质量。
Apr, 2023
Versatile video coding framework is proposed to learn compact representations for both human and machine vision, featuring a feature-based compression loop and cross-domain motion encoder/decoder, with evaluation results showing its compression efficiency on different video tasks with benchmark datasets.
Jun, 2023
本文提出了一种分层学习视频压缩(HLVC)方法,其具有三个分层质量层和一种重复增强网络。我们通过一种图像压缩方法压缩第一层帧,并使用这些帧作为参考来压缩相对高质量的第二层。然后,使用提出的单运动深度压缩(SMDC)网络压缩具有最低质量的第三层。在我们的 HLVC 方法中,分层质量有助于编解码效率,并且最终结果在 PSNR 和 MS-SSIM 方面优于 x265 的 “低延迟 P(LDP)非常快” 模式。
Mar, 2020
本文介绍了一种在特征空间内实现运动估计、压缩、补偿和残差压缩的视频编码网络,通过多帧特征融合模块,并利用非局部注意力机制融合多帧参考特征提高帧重建效果,该网络在四个基准数据集上达到了最先进的性能。
May, 2021
本文提出了一种适用于逐帧视频的感知式学习视频压缩 (Pervetual Learned Video Compression,PLVC) 方法,并首次提出了一种递归条件判别器,该方法可以在保留视频画质和压缩率同时,满足时域上的一致性,而且其性能远远好于现有的学习视频压缩算法及现有标准 HEVC HM 16.20。
Sep, 2021
本文提出了一种多功能的学习视频压缩(VLVC)框架,使用一种模型支持所有可能的预测模式,包括运动补偿模块和流预测模块,可大大减少体素流的传输成本,并在各种情况下支持多功能压缩。实验结果表明,VLVC 不仅支持多功能压缩,还是首个在 MS-SSIM 方面优于最新 VVC/H.266 标准参考软件的端到端学习视频压缩方法。
Nov, 2021
我们提出了一种 ML-based 的视频编码算法,通过评估不同分辨率和基于商业编解码器的标准视频压缩测试集发现,在低延迟模式下相对于 HEVC/H.265, AVC/H.264 和 VP9,我们的算法通常产生更小的代码。并且,我们的方法不会出现图块失真和像素化,可以产生更加视觉上令人愉悦的视频。
Nov, 2018
本文提出了一种新的框架,利用视频压缩的低延迟配置和上下文自适应视频融合方法,提高 BasicVSR ++ 方法的质量,已在 NTIRE22 挑战中得到验证,并在定量指标和视觉质量方面与之前的方法相比均有所提高。
Feb, 2023
本文提出了一种改进的图像压缩模型,通过改善人类感知和效率,实现了与最先进的端到端学习图像压缩方法和经典方法相竞争的主观效果,并且较少解码时间和提供人性化的压缩,通过经验评估,证明了我们提出的方法在实现优秀性能方面的有效性,与相同主观质量相比,节约了超过 25%的比特率。
May, 2023