BriefGPT.xyz
May, 2024
多模态LLMs在基础视觉网络分析中的挑战:VNA基准测试
Multimodal LLMs Struggle with Basic Visual Network Analysis: a VNA Benchmark
HTML
PDF
Evan M. Williams, Kathleen M. Carley
TL;DR
评估了GPT-4和LLaVa在小规模图上执行简单的视觉网络分析任务的零样本能力,并发现尽管GPT-4始终优于LLaVa,但两个模型在所有提出的任务中都难以解决每个视觉网络分析任务,我们还公开发布了首个基于视觉网络分析任务评估VLMs的基准。
Abstract
We evaluate the zero-shot ability of
gpt-4
and
llava
to perform simple
visual network analysis
(VNA) tasks on small-scale graphs. We evalu
→