May, 2018

一种基于李亚普诺夫函数的安全强化学习方法

TL;DR提出了一种基于Lyapunov方法的安全强化学习算法,该算法可在保证行为策略安全的前提下,有效地平衡约束满足和性能优化。