BriefGPT.xyz
Ask
alpha
关键词
3d spatial reasoning
搜索结果 - 2
SpatialVLM:赋予视觉语言模型空间推理能力
通过在互联网规模的空间推理数据上训练 Visual Language Model(VLM),我们显著增强了其在定量和定性空间 VQA 方面的能力,并实现了链式思维空间推理和机器人学等新颖应用。
PDF
5 months ago
ICCV
视觉问答的弱监督相对空间推理
这篇研究报告探讨了视觉和语言推理需要对视觉概念、语义和语言基础以及两种模式之间的相互作用进行感知,并评估了现有的 Vision-and-language 模型对于空间理解的忠实度。研究者提出了两个目标,利用现成的深度估计器,设计了关于三维空
→
PDF
3 years ago
Prev
Next