Feb, 2024

评估视觉语言模型的图像评论能力

TL;DR使用大规模视觉语言模型(LVLMs)为图像生成评价文本。通过基于排名相关分析的评估方法,验证了 LVLMs 在区分高质量和次标准图像评价中的优越性。