Sep, 2023

PolarNet: 基于语言引导的机器人操作的 3D 点云

TL;DR通过使用 3D 点云来进行语言引导的操纵任务,我们提出了一种名为 PolarNet 的策略,该策略通过精心设计的点云输入、高效的点云编码器和多模态变换器来学习 3D 点云表示并将其与语言指令集成以进行行动预测。在 RLBench 基准测试中,PolarNet 在各种实验中显示出了高效和数据高效性,并在单任务和多任务学习中优于最先进的 2D 和 3D 方法。它在实际机器人上也取得了令人期待的结果。