BriefGPT.xyz
大模型
Ask
alpha
关键词
household robots
搜索结果 - 2
LLM-Grounder:使用大型语言模型作为代理人进行开放词汇三维视觉对接
LLM-Grounder 是一种零样本、开放词汇量的基于大型语言模型(LLM)的 3D 视觉定位流水线。通过将复杂自然语言查询拆解为语义元素,并利用可视化定位工具识别 3D 场景中的对象,LLM-Grounder 评估所提议对象之间的空间和
→
PDF
9 months ago
RREx-BoT:用技巧袋处理远程代指表达式
该研究揭示家庭机器人在执行长期任务时通过使用三维编码和视觉语言模型可实现客观目标定位;通过实证研究,该研究表明该方法优于以往的同类工作并适用于实际机器人平台。
PDF
a year ago
Prev
Next