Feb, 2025

多模态奖励基准:视觉语言模型奖励模型的综合评估

TL;DR本研究针对视觉语言模型(VLMs)中缺乏全面的多模态奖励模型评估基准的问题,提出了“多模态奖励基准”。该基准涵盖六个领域,通过5181个标注的数据集对多种VLM模型进行评估,结果显示即使是表现最佳的模型,在推理和安全性领域仍面临挑战。这表明该基准为奖励模型的发展提供了重要的测试平台。