Oct, 2023

CLAIR: 使用大型语言模型评估图像标题

TL;DRCLAIR是一种新颖方法,利用大型语言模型(LLMs)的零-shot语言建模能力来评估候选图像标题,与现有方法相比,CLAIR在与人类判断相符的标题质量方面表现出更强的相关性,能够清晰解读结果与其分配的分数背后的推理过程。