本文提出了一种基于深度生成模型的视频压缩方法,采用三维自编码器和自回归先验以最小化速率失真损失,实现编码效果优于现有的基于运动补偿或插值的视频压缩网络,并且在设计选择和压缩技术方面进行了系统评估和扩展,包括语义压缩、自适应压缩和多模态压缩,以便在非标准成像传感器捕获的多个模态数据上实现联合压缩。
Aug, 2019
文章提出了一种基于深度生成模型和序列数据的变分自编码器模型,用于视频压缩,经测试取得了竞争性的压缩效果。
Oct, 2018
本文通过将自回归生成模型与有损视频压缩任务联系起来,提出了一种基于机器学习的视频压缩方法。大规模视频数据的全面评估表明,在视频数据的压缩比率及失真质量上,该方法优于传统的基于机器学习和基于传统技术的方法。
Oct, 2020
本文提出了一种采用循环自编码器(RAE)和循环概率模型(RPM)的递归学习视频压缩(RLVC)方法,以充分利用视频帧之间的时间相关性,实验结果表明,该方法在 PSNR 和 MS-SSIM 方面都达到了最先进的学习视频压缩性能,优于默认的 x265 低延迟 P(LDP)设置和 SSIM-tuned x265 等。
Jun, 2020
本文提出了一种通过建模帧之间的条件熵来进行视频压缩的方法,与以往的学习方法不同,我们假设每个帧都使用一个独立的先进深度图像压缩器进行编码。我们的方法在保证解码速度的前提下,在高比特率的 UVG 视频中优于 H.265 和其他深度学习基线,在低帧率下优于所有视频编解码器,同时比使用自回归熵模型的深度模型解码速度快数千倍。
Aug, 2020
本研究介绍了两种增强技术:通道调节和潜在残差预测,提出了比现有上下文自适应模型更好的网络架构,该模型在最小化串行处理、保持数据完整性等方面都性能更优,在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下,本研究的模型可使速率提高 18%,比像 BPG 这样的手工工程编解码器提高 25%。
Jul, 2020
我们提出了一种新的方法来优化自动编码器实现有损图像压缩,并通过最小的损失改变来改进了深度自动编码器的性能, 从而实现了高分辨率图像的高效和灵活压缩。
Mar, 2017
该论文提出了一种基于条件自编码器的新型可变速率学习图像压缩框架,在一个网络中进行可变速率图像压缩,并提供拉格朗日乘子和量化 bin 大小两个速率控制参数,实验结果表明该模型提供了更好的率失真权衡。
Sep, 2019
本文提出了一种适用于逐帧视频的感知式学习视频压缩 (Pervetual Learned Video Compression,PLVC) 方法,并首次提出了一种递归条件判别器,该方法可以在保留视频画质和压缩率同时,满足时域上的一致性,而且其性能远远好于现有的学习视频压缩算法及现有标准 HEVC HM 16.20。
Sep, 2021
使用生成模型进行压缩可提高失真度和视觉效果,对视频和图像压缩有效。相比传统的可变长度编码方案,生成压缩的鲁棒性更高,适应于噪声无线信道。