Sep, 2024

MMMU-Pro:更强大的多学科多模态理解基准

TL;DR本文提出了MMMU-Pro,一种强大的多学科多模态理解和推理基准,旨在解决现有基准无法有效评估多模态模型真实理解与推理能力的问题。该研究通过三步流程改进评估标准,发现模型在MMMU-Pro上的表现明显低于MMMU,强调了新基准在现实场景中的应用及其对多模态人工智能未来研究的重要影响。