BriefGPT.xyz
Ask
alpha
关键词
visual spatial reasoning
搜索结果 - 2
基于纯文本语言模型的空间关系基础
文中通过提供对象的显式位置信息并进行适当训练,展示出仅文本的语言模型(Language Models)可以学习到类似 “左侧” 或 “下方” 等空间关系。通过对视觉空间推理(Visual Spatial Reasoning)数据集的一个口语
→
PDF
4 months ago
ACL
视觉空间推理
本研究提出 Visual Spatial Reasoning(VSR)数据集,这是包含超过 10k 已标注的英文自然文本图像对和 66 种空间关系的数据集,研究表明当前视觉语言模型只能达到约 70%的准确率,无法识别有关物体朝向的关系。
PDF
2 years ago
Prev
Next