Oct, 2024
JMMMU:一个针对文化意识评估的日本大型多学科多模态理解基准
JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding
Benchmark for Culture-aware Evaluation
TL;DR本研究解决了现有大型多模态模型在非英语语言环境中的评估不足问题,提出了JMMMU基准,以日本文化为基础评估LMM的专家级任务。通过文化无关和文化特定两个子集的设计,研究表明许多LMM在日语评估中的表现明显下滑,揭示了它们对日本文化理解的不足,从而为未来的多语言LMM开发提供了高标准、文化多样性的基准指导。