Oct, 2023

频率感知变换器用于学习图像压缩

TL;DR学习图像压缩 (LIC) 已成为近年来在图像存储和传输方面的有效解决方案,然而,现有的 LIC 方法存在潜在的表示冗余问题,限制了其对各向异性频率成分和方向细节的捕捉。为了克服这些挑战,我们提出了一种新颖的频率感知变换器 (FAT) 模块,首次实现了对 LIC 的多尺度方向分析。FAT 模块由频率分解窗口注意力 (FDWA) 模块组成,用于捕捉自然图像的多尺度和方向频率成分。此外,我们引入了频率调制前馈网络 (FMFFN),以自适应调制不同频率成分,从而改善了速率失真性能。此外,我们还提出了基于变换器的通道级自回归 (T-CA) 模型,有效地利用了通道依赖性。实验证明,与现有的 LIC 方法相比,我们的方法在速率失真性能上达到了最先进的水平,并在 Kodak、Tecnick 和 CLIC 数据集上相对于最新的标准编解码器 VTM-12.1 提高了 14.5%、15.1% 和 13.0% 的 BD - 率。