用于有损图像压缩的高效非线性转换
描述一种图像压缩方法,其由非线性分析变换、均匀量化器和非线性合成变换构成,并使用卷积线性滤波器和非线性激活函数的三个连续阶段构建变换,其中联合非线性性选择实现形式的局部增益控制,利用随机梯度下降的变体优化整个模型以实现训练图像数据库的速率失真性能,以及一个连续的代理来引入量化器产生的不连续损失函数,具有比标准 JPEG 和 JPEG2000 压缩方法更好的速率失真性能,并且在所有位率下对所有图像的视觉质量均有显著提高。
Nov, 2016
本文研究了如何将生成敌对网络与学习压缩相结合,得到一种最先进的生成有损压缩系统,并在归一化层、生成器和鉴别器架构、训练策略以及感知损失方面进行了探究。与之前的工作不同的是,我们实现了在广泛的比特率范围内视觉上令人满意的重建,并且,我们的方法可以应用于高分辨率图像。我们在定量上使用各种感知指标和用户研究来评估我们的方法,研究表明,即使使用超过 2 倍的比特率,我们的方法也优于以前的方法。
Jun, 2020
本文研究了基于神经网络的压缩器在处理集中于低维流形上的高维数据(如图像)方面的有效性,同时研究了一个连续时间随机过程的最优熵 - 失真权衡并对比了经典的 Karhunen-Loève 变换的压缩器,结果表明基于神经网络的压缩器在训练采用随机梯度下降的情况下可实现最佳性能。
Nov, 2020
提出了基于 Transformer 的非线性变换和包含两个不同超先验的熵模型,通过有效地捕获输入图像的局部和全局信息以及利用远距关系提取长程信息,能够在速率 - 失真性能方面表现优于现有的方法。
Sep, 2023
本篇论文提出了一种基于深度学习的可变比特率图像压缩框架,通过采用更多泛化除法归一化(GDN)层和新型的 GDN 残差子网络,在编码器和解码器网络中加以应用,再结合基于随机四舍五入的可扩展量化,实现了同一模型的多比特率操作和学习多比率图像特征,并在实验中获得了比诸如 H.265/HEVC-based BPG 等标准编解码器和最新的学习可变比率方法更好的表现。
Dec, 2019
本文介绍了一种通用的框架,用于端到端优化非线性变换编码的速率失真性能,可以使用任何可微分的分析和综合变换与任何可微分的感知度量相结合,例如使用多维本地增益控制构建的线性变换后的编码,通过现代感知度量对失真进行测量以优化大型图像数据库上的编码,相较于固定的(DCT)编码以及为均方误差而优化的线性变换编码,该表示提供了显着的比特率和感知外观的改进。
Jul, 2016
本研究探讨了内容自适应优化对神经图像压缩表现的影响,介绍了一种迭代过程,该过程使得潜在表示适应特定内容,同时保持网络和预测模型的参数固定。实验结果表明,与特定结构的模型相比,这种方法能够增加速率 - 失真性能,同时不需要额外传输模型参数更新数据,可用于改进预先训练的网络在不同视觉外观或分辨率的不同内容上的表现。
Jun, 2019
本文针对图像压缩中的深度学习方法进行了研究,提出了一种基于变速率编码器和解码器的分析和合成块,利用卷积层和广义除法归一化 (GDN),并使用像素 RNN 方法进行量化。实验结果表明,所提出的可变速率框架结构,能够优于现有方法和标准图像编解码器,如 George 和 JPEG 等。
Sep, 2021
本文介绍了一种使用正则化流技术的深度图像压缩方法,能够在保证低比特率的情况下实现接近无损的质量,相比传统图像压缩方法有更大范围的质量水平,并能够在多次编码后仍能保持一致的质量结果。此为首次探索正则化流用于有损图像压缩的研究成果。
Aug, 2020