Feb, 2022

多重不确定性集合上的鲁棒策略学习

TL;DR本文提出了一个更加通用的解决方案来解决强化学习中的鲁棒性问题,设计了一种算法,该算法结合了系统识别和鲁棒强化学习的优点,解决在不同情况下的不确定性问题,并在多个控制任务中获得了比之前方法更好的最坏情况执行性能。