多尺度和上下文自适应熵模型用于图像压缩
本文提出了一种上下文自适应熵模型,用于端到端优化的图像压缩。该模型利用两种上下文,即消耗位上下文和无需消耗位上下文,可更准确地估计每个潜在表示的分布,并提高了压缩性能。实验结果表明,该方法在 PSNR 和 MS-SSIM 指标上优于传统图像编解码器,如 BPG 和 JPEG2000,以及其他以人工神经网络为基础的方法。
Sep, 2018
本研究介绍了两种增强技术:通道调节和潜在残差预测,提出了比现有上下文自适应模型更好的网络架构,该模型在最小化串行处理、保持数据完整性等方面都性能更优,在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下,本研究的模型可使速率提高 18%,比像 BPG 这样的手工工程编解码器提高 25%。
Jul, 2020
本文提出了一种基于序列解码过程的因果上下文熵预测的概念,以捕捉图像压缩的全局相关性和跨通道关系,同时,采用新的独立注意力模块构建更强的转换网络,实验结果表明,该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器,达到了最先进的码率失真性能。
Nov, 2020
本研究提出了一种基于 3D-CNN 的条件概率模型方法,用于直接建模图像自动编码器隐层表示的熵,从而控制重构误差和信息熵之间的平衡关系,该方法在 MS-SSIM 能力测试中表现优异,成为一种最新的图像压缩系统。
Jan, 2018
本研究提出了一种新的图像全局参考模型,能够有效利用局部和全局上下文信息,以提高深度图像压缩的性能表现,并且拥有最先进的速率 - 失真性能,同时还新创了一种平均偏移 GDN 模块。
Oct, 2020
提出了基于 Transformer 的非线性变换和包含两个不同超先验的熵模型,通过有效地捕获输入图像的局部和全局信息以及利用远距关系提取长程信息,能够在速率 - 失真性能方面表现优于现有的方法。
Sep, 2023
本文提出了一种交叉通道上下文模型,用于在深度图像压缩中的潜在变量。与传统的 2D mask 卷积只能捕捉空间上下文不同,在局部上下文中,加入交叉通道上下文可以更好地留存邻近通道的信息。
Mar, 2021
本文提出一种多尺度渐进统计模型,兼顾像素级别处理和多尺度处理,能够在不显著降低推理速度的情况下,在两个大型基准数据集上显著优于现有的无损图像压缩方法。
Aug, 2021
本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法,其中使用了超先验来有效地捕获潜在表示中的空间依赖关系,证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能,并提供了不同失真度指标的不同训练模型之间的定性比较。
Feb, 2018