BriefGPT.xyz
Mar, 2024
自然VLM:利用细粒度自然语言进行支配引导的视觉操作
NaturalVLM: Leveraging Fine-grained Natural Language for Affordance-Guided Visual Manipulation
HTML
PDF
Ran Xu, Yan Shen, Xiaoqi Li, Ruihai Wu, Hao Dong
TL;DR
通过提出一个包含15个不同操纵任务的综合基准测试,该论文引入了一个以人类语言指令为基础的家庭助理机器人感知和操作多种3D物体的重大挑战,并通过建立一个新的学习框架逐步完成操纵任务。
Abstract
Enabling
home-assistant robots
to perceive and manipulate a diverse range of
3d objects
based on
human language instructions
is a pivotal
→