May, 2024

SciFIBench:科学图表解读大型多模态模型基准测试

TL;DRSciFIBench是一个科学图表解释的基准测试,评估了26个大型多模态模型在理解和解释图表方面的能力,并探究了模型在拓展问题集上的对齐和推理准确性。