ACLMay, 2024

不要购买!重新评估对比式多模态模型的广告理解能力

TL;DR通过对自动广告理解的对比图像与语言模型进行对比,我们提出了一个新的评估测试集 TRADE,该测试集具有对抗性的基本解释,揭示出模型在多模态推理能力方面的不足。