CVPRMar, 2023
正向增量对比学习在图像和视频字幕评估中的应用
Positive-Augmented Constrastive Learning for Image and Video Captioning Evaluation
Sara Sarto, Manuele Barraco, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara
TL;DR提出了基于对比学习的图像标注评估指标 PAC-S,使用生成的图像和文本进一步统一了对比视觉 - 语义空间的学习,实验中表现最好,超过了 CIDEr、SPICE 和 CLIP-Score 等其他指标。