CVPRMar, 2023

正向增量对比学习在图像和视频字幕评估中的应用

TL;DR提出了基于对比学习的图像标注评估指标 PAC-S,使用生成的图像和文本进一步统一了对比视觉 - 语义空间的学习,实验中表现最好,超过了 CIDEr、SPICE 和 CLIP-Score 等其他指标。