Jun, 2022

学习复杂运动技能的开放式学习策略

TL;DR本文提出了一种 Enhanced Paired Open-Ended Trailblazer (ePOET) 和 Soft Actor-Critic 策略相结合的方法 (ePOET-SAC),用于教授机器人在复杂三维环境下高效行走的复杂技能。实验结果表明,该方法可以成功地学习机器人在不同复杂地形上的运动技能。