Mar, 2024

面向立体图像压缩的内容感知遮罩图像建模变换器

TL;DR该研究提出了一种名为 CAMSIC 的立体图像压缩框架,通过引入一种新颖的内容感知蒙版图像建模(MIM)技术,以独立地将每个图像转换为潜在表示,并采用强大的无解码器 Transformer 熵模型,来捕捉立体图像中的空间位移特征,从而实现了最新的速率失真性能。