Jul, 2022

针对非凸约束和安全强化学习的不确定分段仿射系统的鲁棒性动作控制

TL;DR本文提出了一种可靠的控制方案(Robust Action Governor),它结合了离散时间的分段仿射模型和非凸约束条件,以实现安全强化学习过程的全时约束满足和控制策略的实时演化。研究结果表明,该方法在控制和安全方面都具有很好的效果。