多尺度和上下文自适应熵模型用于图像压缩

CVPROct, 2019

多尺度和上下文自适应熵模型用于图像压缩

Multi-scale and Context-adaptive Entropy Model for Image Compression

Jing Zhou, Sihan Wen, Akira Nakagawa, Kimihiko Kazui, Zhiming Tan

TL;DR本文提出了一种端到端可训练的图像压缩框架，采用自回归和分层先验的组合估计每个潜在表示的分布，并使用一种方法将比特率分配到每个图像以最大化 MS-SSIM。

Abstract

We propose an end-to-end trainable image compression framework with a multi-scale and context-adaptive entropy model, especially for low bitrate compression. Due to the success of →

end-to-end trainable image compression autoregressive priors hierarchical priors low bitrate compression

发现论文，激发创造

面向端到端优化的自适应熵模型图像压缩

本文提出了一种上下文自适应熵模型，用于端到端优化的图像压缩。该模型利用两种上下文，即消耗位上下文和无需消耗位上下文，可更准确地估计每个潜在表示的分布，并提高了压缩性能。实验结果表明，该方法在 PSNR 和 MS-SSIM 指标上优于传统图像编解码器，如 BPG 和 JPEG2000，以及其他以人工神经网络为基础的方法。

Sep, 2018

用于学习图像压缩的通道方向自回归熵模型

本研究介绍了两种增强技术：通道调节和潜在残差预测，提出了比现有上下文自适应模型更好的网络架构，该模型在最小化串行处理、保持数据完整性等方面都性能更优，在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下，本研究的模型可使速率提高 18%，比像 BPG 这样的手工工程编解码器提高 25%。

Jul, 2020

基于因果关系的上下文预测学习图像压缩

本文提出了一种基于序列解码过程的因果上下文熵预测的概念，以捕捉图像压缩的全局相关性和跨通道关系，同时，采用新的独立注意力模块构建更强的转换网络，实验结果表明，该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器，达到了最先进的码率失真性能。

Nov, 2020

深度图像压缩的条件概率模型

本研究提出了一种基于 3D-CNN 的条件概率模型方法，用于直接建模图像自动编码器隐层表示的熵，从而控制重构误差和信息熵之间的平衡关系，该方法在 MS-SSIM 能力测试中表现优异，成为一种最新的图像压缩系统。

Jan, 2018

联合自回归和分层先验用于学习图像压缩

通过引入自回归、分层和联合先验，我们提出了一种新的图像压缩模型，取得了目前最先进的压缩效果。

Sep, 2018

使用全局参考学习精准熵模型进行图像压缩

本研究提出了一种新的图像全局参考模型，能够有效利用局部和全局上下文信息，以提高深度图像压缩的性能表现，并且拥有最先进的速率 - 失真性能，同时还新创了一种平均偏移 GDN 模块。

Oct, 2020

多环境双超先验神经图像压缩

提出了基于 Transformer 的非线性变换和包含两个不同超先验的熵模型，通过有效地捕获输入图像的局部和全局信息以及利用远距关系提取长程信息，能够在速率 - 失真性能方面表现优于现有的方法。

Sep, 2023

深度图像压缩中的跨通道上下文模型

本文提出了一种交叉通道上下文模型，用于在深度图像压缩中的潜在变量。与传统的 2D mask 卷积只能捕捉空间上下文不同，在局部上下文中，加入交叉通道上下文可以更好地留存邻近通道的信息。

Mar, 2021

多尺度渐进统计模型实现无损图像压缩

本文提出一种多尺度渐进统计模型，兼顾像素级别处理和多尺度处理，能够在不显著降低推理速度的情况下，在两个大型基准数据集上显著优于现有的无损图像压缩方法。

Aug, 2021

带有尺度超先验的变分图像压缩

本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法，其中使用了超先验来有效地捕获潜在表示中的空间依赖关系，证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能，并提供了不同失真度指标的不同训练模型之间的定性比较。

Feb, 2018