May, 2024

安全强化学习中平衡奖励与安全性优化:梯度操控视角

TL;DR利用梯度操作理论解决强化学习中奖励和安全之间的冲突,通过提出一种软切换策略优化方法实现奖励和安全的平衡,进而提供一个安全强化学习框架。