Jun, 2024

大型多模态模型时代中的指代表达理解评估再探

TL;DR参考表达理解(REC)涉及根据文本描述定位目标实例。本研究质疑现有基准对大型多模态模型(LMMs)的全面性能力,通过手动检查现有基准,发现高标注错误率,并通过排除问题实例和重新评估多种 LMMs 来解决。为了评估现代 REC 模型,引入了 Ref-L4,一个全面的 REC 基准。在 Ref-L4 上评估了 24 个大模型并提供了有价值的见解。