神经图像压缩中的速率 - 失真 - 复杂性优化探索
通过我们的速率 - 失真计算(RDC)研究,我们展示了虽然浮点运算(FLOPs)和运行时间对于准确地比较神经压缩方法都是不足够的,但我们还是找到了一种新型神经压缩架构,其在计算要求和 RD 性能之间具有最佳的实证权衡。
Sep, 2023
在有损图像压缩中,我们提出了一种 Rate-Distortion-Classification (RDC) 模型,用于优化速率、失真和分类准确性之间的权衡,从而将图像压缩与视觉分析相结合,为实际应用中的端到端图像压缩技术铺平了道路。
May, 2024
本文提出了一种高效的单模型可变位率编解码器,采用 mask decay 和稀疏正则化损失,大幅提升了神经图像压缩的 RD 性能,并通过可扩展编码器进一步减少编解码器复杂度。
Feb, 2023
C3 是一种神经压缩方法,通过对每个图像或视频进行过度拟合从而获得强大的率失真性能,其解码复杂度与其他具有相似率失真性能的神经模型相比可降低一个数量级。C3 在 COOL-CHIC 的基础上进行改进,并且还开发了将 C3 应用于视频的新方法。在 CLIC2020 图像基准测试中,我们将 C3 解码的每个像素的 MAC 数减少到不足 3k,与 H.266 编解码器的 VDH 性能相当。在 UVG 视频基准测试中,我们将 C3 解码的每个像素的 MAC 数减少到不足 5k,与 Video Compression Transformer 的 VDH 性能相当。
Dec, 2023
本研究介绍了两种增强技术:通道调节和潜在残差预测,提出了比现有上下文自适应模型更好的网络架构,该模型在最小化串行处理、保持数据完整性等方面都性能更优,在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下,本研究的模型可使速率提高 18%,比像 BPG 这样的手工工程编解码器提高 25%。
Jul, 2020
本文采用浅层甚至线性解码变换的方法来缩短神经图像压缩的解码复杂度,并通过加强编码器网络和迭代编码来提高压缩性能与解码复杂度之间的平衡,从而实现与传统 ME-Scale 超先验结构相当的失真压缩性能,同时将总解码复杂度降低 80%。
Apr, 2023
近年来,神经网络驱动的图像压缩(NIC)方法备受关注。本文提出了一种可变比率的生成式 NIC 模型,通过多种鉴别器设计和引入新的对抗损失,结合新提出的多真实感技术,用户能够通过单一模型灵活地调整比特率、失真和真实感,实现了极高的可控性并覆盖宽范围的比特率。与已有可变比率生成式 NIC 模型不同的是,本方法在只使用一个模型的情况下,达到或超过最先进的单比率生成式 NIC 模型的性能。
May, 2024
通过使用条件扩散模型,本文展示了它作为解码器时在生成式压缩任务中的良好结果,同时通过采样方法,它们还允许在解码器端基于压缩表示创建新的失真和感知之间的权衡点。
Mar, 2024
本文介绍一种基于自动编码器和潜变量表示的神经压缩方法,并探讨了在训练后适应单个视频、发送模型更新以及重新调整参数等方面的改进措施。结果表明,相较于仅调整编码器的方式,对整个模型进行调整可以提高图像在视频中的压缩性能约 1 dB。
Jan, 2021