BriefGPT.xyz
Ask
alpha
关键词
physically-grounded vlms
搜索结果 - 1
物理基础的视觉语言模型用于机器人操作
通过在 36.9K 个常见家居物体的数据集 PhysObjects 上针对视觉外观捕捉人类先验知识,我们提出了一种基于物理概念的视觉语言模型(VLM),并将其与基于大语言模型的机器人规划器结合使用,取得了在涉及与物理物体概念推理相关的任务中
→
PDF
10 months ago
Prev
Next