Jun, 2023

基于经验规划与自我模仿学习的机器人运动规划的强化学习

TL;DR本文提出了一种称为 SILP + 算法的自我模仿学习方法,将基于经验的规划有效地嵌入到学习架构中,从而缓解了机器人运动规划任务中的数据采集问题,并在复杂的运动规划任务中取得了更好的培训效率和更高稳定的成功率。