ACLJun, 2024

FLEUR:基于大型多模态模型的图像字幕解释性无参考评估度量

TL;DR借助大型多模型,本文提出了一种解释性的无参考度量方法 FLEUR,用以评估图像说明。FLEUR 不需参考说明即能对图像说明进行评估,并提供评分的解释。通过引入评分平滑化以尽可能与人类判断接近,并对用户定义的等级标准具有鲁棒性,FLEUR 在各种图像说明评估基准上与人类判断之间达到了高度相关性,并在 Flickr8k-CF、COMPOSITE 和 Pascal-50S 上取得了最先进的结果,成为了无参考评估度量领域的最新成果。