May, 2024

Plot2Code:用于评估科学图形代码生成的多模态大型语言模型的综合基准

TL;DR通过 Plot2Code 对大规模多模式语言模型的视觉编码进行全面评估,揭示了现有的大多数多模式语言模型在文字密集图中的视觉编码方面存在的困难,重度依赖于文本指导,希望评估结果能指导未来多模式语言模型的发展。