Jun, 2024

利用局部性提高机器人操作中的样本效率

TL;DRSGRv2 是一种通过改进视觉和动作表示来提高样本效率的模仿学习框架,其中关键的归纳偏置 - 动作局部性假设认为机器人的动作主要受目标物体及其与局部环境的交互影响。在模拟和真实环境中进行的广泛实验证明了动作局部性对提高样本效率的重要性。SGRv2 在 RLBench 任务中使用仅 5 个演示并在 26 个任务中超过 RVT 基线,同时在 ManiSkill2 和 MimicGen 中的稠密控制下与 SGR 相比,成功率提高了 2.54 倍。在真实环境中,仅使用八个演示,SGRv2 可以以显著更高的成功率执行各种任务,相比基线模型。