Nov, 2023

可变速率图像压缩的视觉提示调优渐进学习

TL;DR该研究提出了一种渐进学习范式,用于基于变速器的图像压缩。通过使用层自适应提示模块 (LPM) 提取输入图像和编码器端以及解码器端的隐藏特征的提示信息,并将其作为额外信息输入到预训练的基于变速器的图像压缩模型的 Svin Transformer 层中,从而改变了模型的关注区域和位数的分配,进而改变了模型的目标压缩比。通过与仅优化不同目标比率的多模型方法相比较,详尽实验证明了所提出的方法在参数存储上节约了 80% 的空间,节约了 90% 的数据集。同时,我们的模型在速率失真性能方面胜过了所有当前的可变比特率图像方法,并接近从头开始训练的最先进的固定比特率图像压缩方法。