May, 2024

利用单个人类视频的基于视觉的开放世界物体图形操作

TL;DR通过从单个人类视频中提取以对象为中心的操纵计划并推导出条件为提取计划的策略,我们提出了一种以对象为中心的方法,为机器人学习基于视觉的操纵技能提供支持。我们的方法允许机器人从 iPad 等日常移动设备捕获的视频中学习,并将策略推广到具有不同视觉背景、摄像机角度、空间布局和新颖对象实例的部署环境中。通过对短程和长程任务进行系统评估,我们展示了 ORION 在从单个人类视频中学习开放世界中的有效性。