May, 2023

HAAV: 图像字幕增强视图的层次聚合

TL;DR该研究主要利用不同的图像编码方法,来提高图像描述的质量和数据效率,通过在编码视图之间提出对比损失的方式来提高编码质量,并且通过层次式解码器自适应地权衡编码视图的价值,得到了显著的性能提升。