Jul, 2019

Wasserstein 鲁棒性强化学习

TL;DR该研究提出了一种名为 WR2L 的强化学习算法,它通过将 Wasserstein 约束和零阶优化方法结合起来解决了传统强化学习算法在现实世界应用中容易过拟合的问题,并在高维控制任务中得到了显著提升。