Apr, 2022

层次化品质多样性用于在线损伤恢复

TL;DR介绍了分层试错算法,使用分层行为复述学习各种技能并利用这些技能使机器人更适应不同情况。实验表明,与最佳基线相比,我们的方法在迷宫导航任务中需要的行动次数少 20%,而完全失败的通常情况下减少 57%。