AAAIApr, 2023

极端学习图像多模态深度网络压缩

TL;DR本文提出了一种文字引导图像压缩的多模态机器学习方法,通过使用文本的语义信息来引导图像压缩,以实现更好的压缩性能,包括采用图像 - 文本注意力模块和改进的多模态语义一致性损失函数。实验证明,该方法能够在极低比特率下获得较好的视觉效果,并且即使与最先进的技术相比,其性能也可以相媲美或超越。