Sep, 2024
MMMU-Pro:更强大的多学科多模态理解基准
MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding
Benchmark
TL;DR本文提出了MMMU-Pro,一种强大的多学科多模态理解和推理基准,旨在解决现有基准无法有效评估多模态模型真实理解与推理能力的问题。该研究通过三步流程改进评估标准,发现模型在MMMU-Pro上的表现明显低于MMMU,强调了新基准在现实场景中的应用及其对多模态人工智能未来研究的重要影响。