May, 2022

安全强化学习综述:方法、理论与应用

TL;DR该论文从方法、理论和应用的角度回顾了安全强化学习的进展,提出了 “2H3W” 问题并分析了解决这些问题的理论和算法进展;还讨论了安全强化学习方法的样本复杂度,并介绍了相关应用和基准,最后开启了安全强化学习中的挑战问题的讨论并发布了一个包含主要安全强化学习算法实现和教程的基准套件。