Sep, 2023

图像描述生成的无参考度量评估

TL;DR该研究引入了 ContextRef 作为一个基准,用于评估视觉 - 语言模型的参考度量与人类喜好判断的一致性,并通过评估各种预训练模型、评分函数和上下文整合技术来提高描述质量。