Jun, 2022

安全状态增强对安全探索的影响

TL;DR在模型无关强化学习中,通过引入安全状态来解决安全成本稀疏和未知的问题,其价值也作为违约距离,初始值反映了可用的安全预算。该方法有助于制定安全预算调度策略,称为 Simmer,可提高两种安全强化学习问题的安全性,提高平均约束下安全强化学习的性能。