Jun, 2024

II-Bench:基于多模态大型语言模型的图像影响理解基准

TL;DR通过对多个多模态大型语言模型进行实验,我们发现高级图片感知能力方面存在较大差距,并且这些模型在理解高级语义和捕捉图片细节方面存在限制。此外,当提供图片情感极性提示时,大多数模型表现出更好的准确性,暴露出它们对图片情感的内在理解不足。