Jul, 2024

LMMs-Eval: 对大型多模态模型评估的现实检验

TL;DR本研究介绍了LMMS-EVAL,LMMS-EVAL LITE和Multimodal LIVEBENCH,这些评估工具和基准测试解决了大型多模态模型评估的挑战,并提供了实用的解决方案,以在评估中权衡考虑的三个因素,为LMMs的基准测试铺平了道路。