基于神经数据的转换，用于学习图像压缩

CVPRMar, 2022

基于神经数据的转换，用于学习图像压缩

Neural Data-Dependent Transform for Learned Image Compression

Dezhao Wang, Wenhan Yang, Yueyu Hu, Jiaying Liu

TL;DR本文介绍了一种基于学习图像压缩中的神经数据依赖性变换和连续在线模式决策机制的新方法，并探讨了其在编码效率方面的优越性。

Abstract

learned image compression has achieved great success due to its excellent modeling capacity, but seldom further considers the Rate-Distortion Optimization (RDO) of each input image. To explore this potential in the learned codec, we make the first attempt to build a neural data-depende

learned image compression neural data-dependent transform continuous online mode decision neural-syntax coding efficiency

发现论文，激发创造

关于学习图像压缩中颜色空间效应的研究

通过使用 YUV、LAB 和 RGB 颜色空间之间的比较以及它们对学习图像压缩的影响，我们报告了通过在不同数据集上进行实验对 SLIC 模型进行评估，并将结果与最先进的图像编解码器进行比较。

Jun, 2024

学习图像压缩的领域自适应与有监督适配器

通过在解码器中插入适配器模块，我们解决了将预先训练的模型适应于多个目标领域的问题，并使用门网络从适配器中优化地融合贡献，实现了在目标领域上改进的码率失真和编码效率，同时在源领域上没有额外代价。

Apr, 2024

HybridFlow：融合连续性于掩码码本的极低比特率图像压缩

本文研究了极低比特率下的学习图像压缩（LIC）问题，提出了一种新颖的双流框架 HyrbidFlow，结合了基于连续特征和基于码书的流，以在极低比特率下实现高感知质量和高保真性的图像重建。实验结果表明，与现有的单流基于码书或基于连续特征的 LIC 方法相比，在极低比特率下具有优异的性能。

Apr, 2024

通过分层感兴趣区域和自适应量化实现超高保真图像压缩

通过结合 MSE-based 模型和生成模型中感兴趣区域 (ROI) 的优势，我们提出了分层感兴趣区域 (H-ROI) 方法，将图像分为几个前景区域和一个背景区域，以提高包含人脸、文字和复杂纹理的区域的重建效果；进一步，通过通道维度内的非线性映射提出了自适应量化来限制比特率同时保持视觉质量。大量实验证明了我们方法在小脸和文字上以更低的比特率实现了更好的视觉质量，如 HiFiC 的 0.7X 比特和 BPG 的 0.5X 比特。

Mar, 2024

利用边缘信息学习的机器图像编码

图像编码是图像识别中的一种图像压缩技术，本文提出了一种名为 SA-ICM 的方法，其关注对象图像部分的边缘信息的编码和解码，该方法可用于各种图像识别模型，具有数据变化的鲁棒性，并从隐私角度提供保护。此外，SA-ICM 方法还可应用于训练用于视频压缩的 NeRV 模型，通过使用 Segment Anything 创建的边缘信息，可以创建适用于图像识别的 NeRV 模型（SA-NeRV）。实验结果证实 SA-ICM 在图像压缩方面的优势，并且 SA-NeRV 在机器的视频压缩中优于普通的 NeRV。

Mar, 2024

通过条件扩散解码器增强学习图像编解码器的速率失真感知灵活性

通过使用条件扩散模型，本文展示了它作为解码器时在生成式压缩任务中的良好结果，同时通过采样方法，它们还允许在解码器端基于压缩表示创建新的失真和感知之间的权衡点。

Mar, 2024

基于分割先验的区域自适应变换图像压缩

通过使用类别 - 不可知分割掩模和区域适应转换，本文提出了一种改进的学习图像压缩方法，以提高像素保真度和比特率节省。

Mar, 2024

通过可调变换将学得图像编解码器适应屏幕内容

通过引入参数化和可逆的线性变换，我们的研究提出了一种方法来改善针对屏幕内容图像的学习图像编解码器（LICs）的编码效率，并在不改变基线编解码器操作流的情况下设计了两个神经网络作为预处理器和后处理器，从而帮助增加编码效率并减少编码的伪影。我们的端到端训练方法在屏幕内容图像压缩中相比基线的 LICs 实现了高达 10% 的比特率节省，同时只引入了额外的 1% 参数。

Feb, 2024

学习式图像压缩与文本质量增强

通过使用我们提出的文本逻辑损失函数，在图片压缩中获得显著的文本重建质量提高，其结果显示平均字符错误率 (CER) 下降了 -32.64%，单词错误率 (WER) 下降了 -28.03%，并且我们还提出了适用于评估图像压缩中文本质量的定量指标。

Feb, 2024

联合端到端图像压缩和去噪：利用对比学习和多尺度自注意机制

本文提出了一种集成多尺度去噪器的新方法，用于联合图像压缩和去噪。通过强调噪声与干净图像之间的相关性，采用对比学习的方式来提高网络区分噪声与高频信号的能力，实验证明该方法在失真性能和编解码速度方面优于当前的最新技术水平。

Feb, 2024