多模态LLMs在基础视觉网络分析中的挑战：VNA基准测试

May, 2024

Multimodal LLMs Struggle with Basic Visual Network Analysis: a VNA Benchmark

Evan M. Williams, Kathleen M. Carley

TL;DR评估了GPT-4和LLaVa在小规模图上执行简单的视觉网络分析任务的零样本能力，并发现尽管GPT-4始终优于LLaVa，但两个模型在所有提出的任务中都难以解决每个视觉网络分析任务，我们还公开发布了首个基于视觉网络分析任务评估VLMs的基准。

Abstract

We evaluate the zero-shot ability of gpt-4 and llava to perform simple visual network analysis (VNA) tasks on small-scale graphs. We evalu