Jan, 2024

Robo-ABC: 通过语义对应实现机器人操作中的类别以外物体能力泛化

TL;DR通过从人类视频中提取联系点、并借鉴人类思维方式,我们提出了 Robo-ABC 框架,在不需要任何手动注释、附加训练、部分分割、预编码知识或视角限制的情况下,使机器人能够通过检索视觉或语义上相似的对象来获得关于操作性的信息,并将其映射到新对象上,从而实现对类别之外的对象的零样本操作。在视觉操作性检索上,Robo-ABC 达到了相对于最先进的端到端操作模型的 31.6% 的显著提高,并通过现实世界的物体抓取任务实验,取得了 85.7% 的成功率,证明了其在真实世界任务中的能力。