NIPSNov, 2017

深度强化学习和进化算法在连续控制中的比较

TL;DR对含复杂控制问题的强化学习和进化策略这两种方法进行了并行化改进,同时在深度强化学习领域比较了进化方法和深度强化学习方法,结果显示两种方法没有一个持续的胜者。