基于神经数据的转换,用于学习图像压缩
通过使用 YUV、LAB 和 RGB 颜色空间之间的比较以及它们对学习图像压缩的影响,我们报告了通过在不同数据集上进行实验对 SLIC 模型进行评估,并将结果与最先进的图像编解码器进行比较。
Jun, 2024
通过在解码器中插入适配器模块,我们解决了将预先训练的模型适应于多个目标领域的问题,并使用门网络从适配器中优化地融合贡献,实现了在目标领域上改进的码率失真和编码效率,同时在源领域上没有额外代价。
Apr, 2024
本文研究了极低比特率下的学习图像压缩(LIC)问题,提出了一种新颖的双流框架 HyrbidFlow,结合了基于连续特征和基于码书的流,以在极低比特率下实现高感知质量和高保真性的图像重建。实验结果表明,与现有的单流基于码书或基于连续特征的 LIC 方法相比,在极低比特率下具有优异的性能。
Apr, 2024
通过结合 MSE-based 模型和生成模型中感兴趣区域 (ROI) 的优势,我们提出了分层感兴趣区域 (H-ROI) 方法,将图像分为几个前景区域和一个背景区域,以提高包含人脸、文字和复杂纹理的区域的重建效果;进一步,通过通道维度内的非线性映射提出了自适应量化来限制比特率同时保持视觉质量。大量实验证明了我们方法在小脸和文字上以更低的比特率实现了更好的视觉质量,如 HiFiC 的 0.7X 比特和 BPG 的 0.5X 比特。
Mar, 2024
图像编码是图像识别中的一种图像压缩技术,本文提出了一种名为 SA-ICM 的方法,其关注对象图像部分的边缘信息的编码和解码,该方法可用于各种图像识别模型,具有数据变化的鲁棒性,并从隐私角度提供保护。此外,SA-ICM 方法还可应用于训练用于视频压缩的 NeRV 模型,通过使用 Segment Anything 创建的边缘信息,可以创建适用于图像识别的 NeRV 模型(SA-NeRV)。实验结果证实 SA-ICM 在图像压缩方面的优势,并且 SA-NeRV 在机器的视频压缩中优于普通的 NeRV。
Mar, 2024
通过使用条件扩散模型,本文展示了它作为解码器时在生成式压缩任务中的良好结果,同时通过采样方法,它们还允许在解码器端基于压缩表示创建新的失真和感知之间的权衡点。
Mar, 2024
通过引入参数化和可逆的线性变换,我们的研究提出了一种方法来改善针对屏幕内容图像的学习图像编解码器(LICs)的编码效率,并在不改变基线编解码器操作流的情况下设计了两个神经网络作为预处理器和后处理器,从而帮助增加编码效率并减少编码的伪影。我们的端到端训练方法在屏幕内容图像压缩中相比基线的 LICs 实现了高达 10% 的比特率节省,同时只引入了额外的 1% 参数。
Feb, 2024
通过使用我们提出的文本逻辑损失函数,在图片压缩中获得显著的文本重建质量提高,其结果显示平均字符错误率 (CER) 下降了 -32.64%,单词错误率 (WER) 下降了 -28.03%,并且我们还提出了适用于评估图像压缩中文本质量的定量指标。
Feb, 2024
本文提出了一种集成多尺度去噪器的新方法,用于联合图像压缩和去噪。通过强调噪声与干净图像之间的相关性,采用对比学习的方式来提高网络区分噪声与高频信号的能力,实验证明该方法在失真性能和编解码速度方面优于当前的最新技术水平。
Feb, 2024