- 关于学习图像压缩中颜色空间效应的研究
通过使用 YUV、LAB 和 RGB 颜色空间之间的比较以及它们对学习图像压缩的影响,我们报告了通过在不同数据集上进行实验对 SLIC 模型进行评估,并将结果与最先进的图像编解码器进行比较。
- 学习图像压缩的领域自适应与有监督适配器
通过在解码器中插入适配器模块,我们解决了将预先训练的模型适应于多个目标领域的问题,并使用门网络从适配器中优化地融合贡献,实现了在目标领域上改进的码率失真和编码效率,同时在源领域上没有额外代价。
- HybridFlow:融合连续性于掩码码本的极低比特率图像压缩
本文研究了极低比特率下的学习图像压缩(LIC)问题,提出了一种新颖的双流框架 HyrbidFlow,结合了基于连续特征和基于码书的流,以在极低比特率下实现高感知质量和高保真性的图像重建。实验结果表明,与现有的单流基于码书或基于连续特征的 L - 通过分层感兴趣区域和自适应量化实现超高保真图像压缩
通过结合 MSE-based 模型和生成模型中感兴趣区域 (ROI) 的优势,我们提出了分层感兴趣区域 (H-ROI) 方法,将图像分为几个前景区域和一个背景区域,以提高包含人脸、文字和复杂纹理的区域的重建效果;进一步,通过通道维度内的非线 - 利用边缘信息学习的机器图像编码
图像编码是图像识别中的一种图像压缩技术,本文提出了一种名为 SA-ICM 的方法,其关注对象图像部分的边缘信息的编码和解码,该方法可用于各种图像识别模型,具有数据变化的鲁棒性,并从隐私角度提供保护。此外,SA-ICM 方法还可应用于训练用于 - 通过条件扩散解码器增强学习图像编解码器的速率失真感知灵活性
通过使用条件扩散模型,本文展示了它作为解码器时在生成式压缩任务中的良好结果,同时通过采样方法,它们还允许在解码器端基于压缩表示创建新的失真和感知之间的权衡点。
- 基于分割先验的区域自适应变换图像压缩
通过使用类别 - 不可知分割掩模和区域适应转换,本文提出了一种改进的学习图像压缩方法,以提高像素保真度和比特率节省。
- 学习式图像压缩与文本质量增强
通过使用我们提出的文本逻辑损失函数,在图片压缩中获得显著的文本重建质量提高,其结果显示平均字符错误率 (CER) 下降了 -32.64%,单词错误率 (WER) 下降了 -28.03%,并且我们还提出了适用于评估图像压缩中文本质量的定量指标 - 联合端到端图像压缩和去噪:利用对比学习和多尺度自注意机制
本文提出了一种集成多尺度去噪器的新方法,用于联合图像压缩和去噪。通过强调噪声与干净图像之间的相关性,采用对比学习的方式来提高网络区分噪声与高频信号的能力,实验证明该方法在失真性能和编解码速度方面优于当前的最新技术水平。
- 通过端到端的 JND 优化实现的感知学习图像压缩
本论文通过将 JND 原则融入学习图像压缩(LC)的训练过程中,提出了三种感知优化方法以及评估结果,证明了 JND 整合对于增强速率 - 失真表现和视觉质量的有效性,相比基线方法,所提出的方法在训练后不增加额外复杂性。
- 具有空间 - 时间超分辨率的条件神经网络视频编码
该研究论文提出了一个视频轨道的图像压缩方法,采用了混合编码框架以及一些新技术,包括使用 Spynet 网络进行准确的运动矢量估计,引入上下文挖掘方案以充分利用空时信息,以及整合空时超分辨率模块提高速率失真性能。
- 可转移的学习图像压缩抗扰动
对利用学习型图像压缩器作为预处理模块的图像分类模型进行了具有增强传递性的对抗攻击方法的探索与实验。
- 高效的学习图片压缩的 Corner-to-Center 长距离上下文模型
在学习图像压缩框架中,上下文模型在捕捉潜在表示之间的依赖关系方面起到关键作用。为了减少串行自回归上下文模型导致的解码时间,提出了并行上下文模型作为一种替代方法,在解码阶段只需要两个传递,从而方便实现真实场景中的高效图像压缩。然而,由于其不完 - 频率感知变换器用于学习图像压缩
学习图像压缩 (LIC) 已成为近年来在图像存储和传输方面的有效解决方案,然而,现有的 LIC 方法存在潜在的表示冗余问题,限制了其对各向异性频率成分和方向细节的捕捉。为了克服这些挑战,我们提出了一种新颖的频率感知变换器 (FAT) 模块, - 仅使用基于注意力的神经网络进行图像压缩
本研究探讨了只使用注意力层进行图像压缩的可行性,并在我们的新模型 QPressFormer 中引入了学习的图像查询的概念,通过交叉注意力聚合补丁信息,然后进行量化和编码技术,通过对 Kodak、DIV2K 和 CLIC 数据集进行全面评估, - 关于学习图像压缩的统一标量量化
基于梯度训练的学习图像压缩中,量化方法的选择对于训练和测试的匹配性和梯度估计的风险存在权衡,本研究提出了一种基于随机均匀退火的方法,通过可调的温度系数来控制权衡,并使用两个巧妙的技巧改进了现有的量化方法,取得了比代表性图像压缩网络上现有方法 - 动态基于核的自适应空间聚合方法用于学习图像压缩
在本研究中,我们扩展了空间聚合能力并提出了一种动态内核的变换编码方法,使用自适应聚合产生内核偏移来捕获有效信息,同时引入了广义粗到细的熵模型和不对称的空间通道熵模型,实验结果表明我们的方法在三个基准测试中达到了优于最先进的基于学习的方法的速 - 极低比特率图像压缩下的更多掩蔽
本文提出了一种新颖的双自适应掩膜 (DA-Mask) 方法,该方法结合了贴片结构和纹理分布,在极低比特率下有效压缩图像。同时,该研究还结合预先训练的掩膜自编码器 (MAE) 和 DA-Mask 以及 LIC 网络提出了一种基于贴片图像建模 - 通过感知度微扰修复学习图像压缩的重构失真
本论文旨在研究如何对学习图像压缩进行不可察觉攻击,并使用基于 Frobenius 范数的损失函数和不可察觉性约束在 Kodak 数据集上进行实验,表明了该方法的有效性并提供了未来设计防御策略的建议。
- 基于 Transformer 的变率图像压缩与感兴趣区域控制
本文提出了一种基于 transformer 学习的图像压缩系统,通过使用 prompt generation 网络,支持 RO I 功能,并允许同时实现可变速和 ROI 编码。实验结果表明,该方法优于其他竞争方法。