Oct, 2023

学习具有物体为中心的三维表示的可泛化的操作策略

TL;DRGROOT 是一种基于模仿学习的方法,利用物体中心化和 3D 先验知识来学习鲁棒策略,通过构建鲁棒的物体中心化 3D 表示,并使用基于 Transformer 的策略对这些表示进行推理。此外,我们还引入了分割对应模型,使策略能够在测试时适用于新的物体。通过全面的实验,我们验证了 GROOT 在模拟和真实环境中对感知变化的鲁棒性,GROOT 在应对背景变化、摄像机视角变化和新物体实例等方面具有优越的泛化能力,而最先进的端到端学习方法和基于物体提议的方法都表现不佳。我们还在真实机器人上广泛评估了 GROOT 策略,在非常复杂的环境变化下展示了其有效性。