Dec, 2022

评估基于模型无关的强化学习在安全关键任务中的应用

TL;DR本研究提出了一种新的安全强化学习技术,即Unrolling Safety Layer方法,它通过结合安全优化和安全投影的方式来显式地强制实施硬性约束条件,该技术在学习零成本回报政策上具有良好的鲁棒性和适用性,并且实现了与算法评估的有机结合。