面向内容的学习图像压缩
本研究探讨了内容自适应优化对神经图像压缩表现的影响,介绍了一种迭代过程,该过程使得潜在表示适应特定内容,同时保持网络和预测模型的参数固定。实验结果表明,与特定结构的模型相比,这种方法能够增加速率 - 失真性能,同时不需要额外传输模型参数更新数据,可用于改进预先训练的网络在不同视觉外观或分辨率的不同内容上的表现。
Jun, 2019
本文提出一种内容加权的编码器 - 解码器模型,配合重要性掩模子网,通过局部自适应的比特率分配和控制方法,有效地进行学习型有损图像压缩,同时通过修剪的卷积神经网络实现对量化编码方法的有损压缩。实验证实该方法可以比深度和传统有损图像压缩方法获得更优成果。
Apr, 2019
应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题,通过训练一个特定的卷积神经网络,实现对图像语义的理解,并通过对每个对象训练特征的方式生成高质量的压缩图像。
Dec, 2016
本文提出了一种文字引导图像压缩的多模态机器学习方法,通过使用文本的语义信息来引导图像压缩,以实现更好的压缩性能,包括采用图像 - 文本注意力模块和改进的多模态语义一致性损失函数。实验证明,该方法能够在极低比特率下获得较好的视觉效果,并且即使与最先进的技术相比,其性能也可以相媲美或超越。
Apr, 2023
本文介绍了一种层次生成式图像压缩模型,该模型支持多任务分析,通过学习感知图像压缩方法提供可压缩的紧凑表示,并实现高分辨率图像重建以及压缩率和感知性能的平衡。实验结果表明,该模型对于 RGB 基于方法可以降低 99.6% 的比特率并实现可比拟的分析结果。
Apr, 2023
本研究设计了一种基于神经网络的端到端学习的机器目标图像编解码器,通过一系列训练策略,解决了计算机视觉任务损失、图像失真损失和数据率损失之间竞争的问题,并在目标检测和实例分割任务中取得了比 VVC 标准更好的表现,是首个端到端学习的针对机器的图像编解码器。
Aug, 2021
本文提出了一种改进的图像压缩模型,通过改善人类感知和效率,实现了与最先进的端到端学习图像压缩方法和经典方法相竞争的主观效果,并且较少解码时间和提供人性化的压缩,通过经验评估,证明了我们提出的方法在实现优秀性能方面的有效性,与相同主观质量相比,节约了超过 25%的比特率。
May, 2023
我们提出了一种端到端学习的图像压缩编解码器,其中分析变换与目标分类任务同时训练。该研究证实,压缩的潜在表示能够以与定制的基于深度神经网络的质量指标相媲美的准确性预测人的感知距离判断。我们进一步研究了各种神经编码器,并展示了将分析变换作为超出质量判断之外的图像任务的感知损失网络的有效性。我们的实验表明,现成的神经编码器在感知建模方面表现出色,无需额外的 VGG 网络。我们期望这项研究能够成为开发语义感知和编码高效的神经编码器的有价值参考。
Jan, 2024
利用经典和深度学习的图像压缩方法对基于深度学习的图像处理模型进行分析并比较,表明深度学习的压缩技术在 2D 情况下在保持预测准确性的同时显著优于传统方法,并对图像压缩对下游深度学习图像分析模型的影响进行评估。
Nov, 2023