Nov, 2019

基于深度强化学习的形态和行为数据高效协同适应

TL;DR本文提出了一种基于深度强化学习和软演员 - 评论家算法的全新方法:将机器人形态与其控制器自动高效地协同适应,以降低试验形态与行为的数量,并使用先前测试过的形态和行为来估计新候选形态的性能,该方法在真实世界中实现机器人设计的协同适应尤为适用。