Mar, 2024

自然 VLM:利用细粒度自然语言进行支配引导的视觉操作

TL;DR通过提出一个包含 15 个不同操纵任务的综合基准测试,该论文引入了一个以人类语言指令为基础的家庭助理机器人感知和操作多种 3D 物体的重大挑战,并通过建立一个新的学习框架逐步完成操纵任务。