Jun, 2022
安全状态增强对安全探索的影响
Effects of Safety State Augmentation on Safe Exploration
Aivar Sootla, Alexander I. Cowen-Rivers, Jun Wang, Haitham Bou Ammar
TL;DR在模型无关强化学习中,通过引入安全状态来解决安全成本稀疏和未知的问题,其价值也作为违约距离,初始值反映了可用的安全预算。该方法有助于制定安全预算调度策略,称为 Simmer,可提高两种安全强化学习问题的安全性,提高平均约束下安全强化学习的性能。