PUB：用于评估大型语言模型在合成视觉数据解读上的绘图理解基准和数据集

Sep, 2024

PUB：用于评估大型语言模型在合成视觉数据解读上的绘图理解基准和数据集

PUB: Plot Understanding Benchmark and Dataset for Evaluating Large Language Models on Synthetic Visual Data Interpretation

HTML

PDF

Aneta Pawelec, Victoria Sara Wesołowska, Zuzanna Bączek, Piotr Sankowski

TL;DR本研究解决了大型语言模型（LLMs）在解读各种数据可视化（如时间序列、直方图等）中的能力不足的问题。通过构建一个新颖的合成数据集并使用多模态文本提示评估多种先进模型，研究展示了LLMs识别和理解视觉数据的能力，揭示出其在不同视觉数据解释方面的优缺点，从而为未来的研究提供了基础基准。

Abstract

The ability of Large Language Models (LLMs) to interpret visual representations of data is crucial for advancing their application in data analysis and decision-making processes. This paper presents a novel Synthetic Da

发现论文，激发创造

LLMMaps -- 大型语言模型分层评估的可视化隐喻

提出了LLMMaps作为一种新的可视化技术来评估大型语言模型的性能，可以支持分层评估，来更好地评估LLM的风险并引导未来的发展。LLMMaps可以将Q&A数据集以及LLM响应转换为内部知识结构进行详细分析，并允许多个LLM进行比较。

Apr, 2023

ChartBench：图表中的复杂可视推理基准

通过更复杂的视觉逻辑和引入 ChartBench 基准，准确衡量 MLLMs 在图表数据中的基本理解能力和数据可靠性，并揭示了它们的局限性，以激发研究界对 MLLMs 的图表理解能力更加关注。

Dec, 2023

大型语言模型用于时间序列的研究概述

该综述论文详细探讨了利用大型语言模型进行时间序列分析的各种方法，包括直接提示、时间序列量化、对齐技术、利用视觉作为桥梁机制以及与其他工具的结合，同时提供了现有的多模态时间序列和文本数据集的综合概述，并分析了该新兴领域的挑战和未来机会。

Feb, 2024

SEED-Bench-2-Plus：基于多模态大型语言模型的文本丰富视觉理解基准测试

我们介绍了SEED-Bench-2-Plus，这是一个专门设计用于评估MLLMs的文本丰富视觉理解的基准，通过涵盖现实世界中的三个广泛类别（图表、地图和网络），它们有效地模拟了复杂多样的文本丰富环境，并强调了当前MLLMs在文本丰富视觉理解方面的限制。

Apr, 2024

Plot2Code：用于评估科学图形代码生成的多模态大型语言模型的综合基准

通过Plot2Code对大规模多模式语言模型的视觉编码进行全面评估，揭示了现有的大多数多模式语言模型在文字密集图中的视觉编码方面存在的困难，重度依赖于文本指导，希望评估结果能指导未来多模式语言模型的发展。

May, 2024

大型视觉语言模型对图表理解和推理的挑战：LVLM的能力与限制的广泛调查

本研究通过对大型视觉语言模型（LVLMs）的全面评估，揭示了它们在图表理解和推理任务中的优势和局限性，并提供了未来研究的启示。

Jun, 2024

大语言模型时代的数据可视化基准测试：VisEval

提出了一种名为VisEval的新的NL2VIS基准，该基准通过引入高质量大规模数据集并倡导综合自动化评估方法，揭示了目前研究中普遍存在的挑战并为未来的进一步发展提供了重要的见解。

Jul, 2024

多模态大语言模型的可视化能力：一项比较研究

利用可视化素养的概念评估多模式大语言模型（MLLMs）的性能，研究表明MLLMs在可视化素养方面具有竞争力，能够优于人类在识别相关性、聚类和层次结构等任务中。

Jun, 2024

大型语言模型能理解符号图形程序吗？

本研究解决了大型语言模型（LLMs）在理解符号图形程序方面的能力评估问题。这项研究提出了一种新方法，通过构建一个大型基准评估LLMs的语义理解能力，并发现LMS在处理视觉场景推理上存在显著差异。最后，引入符号指令微调（SIT）来提升模型的理解能力和指令跟从能力。

Aug, 2024

大型语言模型辅助的可视分析：机遇与挑战

本研究探讨了将大型语言模型（LLMs）集成到可视分析系统中的方法，以通过直观的自然语言交互提升其能力。关键发现是LLMs能够改变可视分析的传统流程，提供新的多模态交互机会，同时也指出了当前使用LLMs在可视分析任务中面临的重要挑战。

Sep, 2024