Mar, 2022

通过生成对抗自我模仿学习从示范中学习类别级可搬移物体操作策略

TL;DR本文通过模仿学习的方式解决在复杂情况下通过学习实现物体操作技能的问题,提出了一种可以应用于各项任务的无先验奖励的泛化策略学习方法,并通过几个关键技术,包括生成式对抗自我模仿学习、不断完善的判别器和平衡专家池中的实例,显著提高了分类水平操作策略学习的效率和泛化能力。实验结果在 ManiSkill 基准测试中都有明显改善。