Sep, 2024

PUB:用于评估大型语言模型在合成视觉数据解读上的绘图理解基准和数据集

TL;DR本研究解决了大型语言模型(LLMs)在解读各种数据可视化(如时间序列、直方图等)中的能力不足的问题。通过构建一个新颖的合成数据集并使用多模态文本提示评估多种先进模型,研究展示了LLMs识别和理解视觉数据的能力,揭示出其在不同视觉数据解释方面的优缺点,从而为未来的研究提供了基础基准。