Nov, 2024
NEMO: 多模态大型语言模型能否识别属性修改的物体?
NEMO: Can Multimodal LLMs Identify Attribute-Modified Objects?
TL;DR本文研究了多模态大型语言模型在识别被特定属性修改的物体方面的能力,填补了这一研究空白。我们提出了一个新的基准NEMO,评估了26种近期开源和商业模型的表现,发现这些模型在准确识别属性修改物体上存在显著性能差距,并指出模型规模扩大可能会削弱视觉编码器的表现。这一发现为未来多模态模型的发展提供了重要启示。