Aug, 2024
图像到文本生成的新评价框架
A Novel Evaluation Framework for Image2Text Generation
TL;DR本研究解决了自动生成图像描述质量评估中的挑战,尤其是现有自动化评估指标与人工判断之间的相关性不足。通过引入一种基于现代大型语言模型(如GPT-4或Gemini)的新评估框架,我们将生成的描述与相应的生成图像进行相似性比较,从而客观评估图像描述模型的有效性。这一方法在无需人工注释的情况下,能够有效评估图像描述的准确性,为相关研究提供了新的工具。