BriefGPT.xyz
Ask
alpha
关键词
multipanel images
搜索结果 - 1
面包或吉娃娃?用多面板视觉语言模型挑战性大的 VQA 任务
通过介绍 Multipanel Visual Question Answering (MultipanelVQA) 基准测试,本研究揭示了 Large Vision Language Models (LVLMs) 对于多子图像的理解存在的挑
→
PDF
5 months ago
Prev
Next