Mar, 2024

自然VLM:利用细粒度自然语言进行支配引导的视觉操作

TL;DR通过提出一个包含15个不同操纵任务的综合基准测试,该论文引入了一个以人类语言指令为基础的家庭助理机器人感知和操作多种3D物体的重大挑战,并通过建立一个新的学习框架逐步完成操纵任务。