Jan, 2019

动作鲁棒性强化学习及其在连续控制中的应用

TL;DR研究了如何在存在不确定性的情况下通过改进强化学习算法来实现机器人动作鲁棒性,以此应对干扰和突发情况,并探讨其潜在的正则化效果。