Jul, 2024

MMSci:一种用于博士级科学理解的多模态多学科数据集

TL;DR通过收集自然通讯期刊中的开放获取科学文章,我们构建了一个多模态、多学科的数据集,对大型语言模型(LLM)和大型多模态模型(LMM)进行综合评估,结果表明这些模型在理解科学图表和内容方面面临极大挑战,并提出了基于视觉指令跟随数据的训练方法来改善性能。