Jun, 2024

一次性可控生成图像压缩与动态粒度适应

TL;DR提出了一种可控生成图像压缩框架 (Control-GIC),首次实现了在广泛频谱范围内的精细比特率调整,确保高保真度和通用性压缩。基于 VQGAN 框架,将图像表示为可变长度代码的序列,通过与局部图像块的信息密度相关联,实现了动态调整代码数量的不同粒度决策,进而实现了理想的压缩速率。实验结果表明,Control-GIC 在高度灵活和可控比特率适应性方面表现出优越性能。