基于图像的局部熵模型的学习图像压缩

May, 2018

基于图像的局部熵模型的学习图像压缩

Image-Dependent Local Entropy Models for Learned Image Compression

David Minnen, George Toderici, Saurabh Singh, Sung Jin Hwang, Michele Covell

TL;DR本文介绍了一种通过加入图像依赖的信息来提高基于人工神经网络的图像压缩方法的性能的方法，并在标准评估数据集上实现了 17.8％的速率降低和 70-98％的在视觉复杂性低的图像上的性能提升。

Abstract

The leading approach for image compression with artificial neural networks (ANNs) is to learn a nonlinear transform and a fixed entropy model that are optimized for →

image compression artificial neural networks entropy models rate-distortion performance image-dependent side information

发现论文，激发创造

联合全局和局部分层先验的学习图像压缩

通过 attention 机制，我们提出了一种新的信息变换学习熵模型，能更好地处理图像压缩的全局和局部依赖关系，实验证明该模型取得了优于现有技术的率失真性能，并且没有二次计算复杂度问题。

Dec, 2021

使用全局参考学习精准熵模型进行图像压缩

本研究提出了一种新的图像全局参考模型，能够有效利用局部和全局上下文信息，以提高深度图像压缩的性能表现，并且拥有最先进的速率 - 失真性能，同时还新创了一种平均偏移 GDN 模块。

Oct, 2020

学习基于上下文的非局部熵建模用于图像压缩

本文提出了基于全局相似性的非局部关注块来进行上下文建模，在熵编码中应用该方法，进而在联合速率失真优化中引导分析转换与合成转换网络的训练，并最终使用 U-Net 块增加转换的宽度，从而在 Kodak 和 Tecnick 数据集上实现了超越现有标准与最新深度图像压缩模型的低失真压缩。

May, 2020

面向端到端优化的自适应熵模型图像压缩

本文提出了一种上下文自适应熵模型，用于端到端优化的图像压缩。该模型利用两种上下文，即消耗位上下文和无需消耗位上下文，可更准确地估计每个潜在表示的分布，并提高了压缩性能。实验结果表明，该方法在 PSNR 和 MS-SSIM 指标上优于传统图像编解码器，如 BPG 和 JPEG2000，以及其他以人工神经网络为基础的方法。

Sep, 2018

多环境双超先验神经图像压缩

提出了基于 Transformer 的非线性变换和包含两个不同超先验的熵模型，通过有效地捕获输入图像的局部和全局信息以及利用远距关系提取长程信息，能够在速率 - 失真性能方面表现优于现有的方法。

Sep, 2023

用于学习图像压缩的通道方向自回归熵模型

本研究介绍了两种增强技术：通道调节和潜在残差预测，提出了比现有上下文自适应模型更好的网络架构，该模型在最小化串行处理、保持数据完整性等方面都性能更优，在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下，本研究的模型可使速率提高 18%，比像 BPG 这样的手工工程编解码器提高 25%。

Jul, 2020

深度图像压缩的条件概率模型

本研究提出了一种基于 3D-CNN 的条件概率模型方法，用于直接建模图像自动编码器隐层表示的熵，从而控制重构误差和信息熵之间的平衡关系，该方法在 MS-SSIM 能力测试中表现优异，成为一种最新的图像压缩系统。

Jan, 2018

带有尺度超先验的变分图像压缩

本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法，其中使用了超先验来有效地捕获潜在表示中的空间依赖关系，证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能，并提供了不同失真度指标的不同训练模型之间的定性比较。

Feb, 2018

基于因果关系的上下文预测学习图像压缩

本文提出了一种基于序列解码过程的因果上下文熵预测的概念，以捕捉图像压缩的全局相关性和跨通道关系，同时，采用新的独立注意力模块构建更强的转换网络，实验结果表明，该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器，达到了最先进的码率失真性能。

Nov, 2020

神经编解码器中基于拉普拉斯的熵模型与模糊扩散合成

我们提出了一种使用非各向同性扩散模型的图像压缩框架，该模型在解码器端引入了一种感知偏差，以生成高质量图像。此外，我们还使用了一种新颖的熵模型来准确建模潜在表示的概率分布，并利用潜在空间中的空间通道相关性来加速熵解码。实验证明，我们的框架在感知质量上优于现有的生成模型编解码器，并且所提出的熵模型能够实现显著的比特率节省。

Mar, 2024