Apr, 2021

CLIPScore:一种基于参照无关的图像字幕评估指标

TL;DR自然语言和图片联合训练的 CLIP 模型可用于基于图像的字幕的评估过程中,而无需参考词,CLIPScore 作为一种新的无参考评估指标可以实现与人类判断的最高相关性。