Mar, 2024

基于采样的安全强化学习在非线性动力系统中的应用

TL;DR我们开发了一种可证明安全和收敛的非线性动态系统控制的强化学习算法,填补了控制理论的强安全性保证和强化学习理论的收敛保证之间的差距。我们的方法通过单阶段的基于采样的方式,在学习过程和实际应用中满足硬约束条件,同时享有经典的收敛保证,我们在仿真环境中验证了我们方法的有效性,包括一个具有挑战性障碍避免问题的四旋翼无人机的安全控制,并证明其胜过现有的基准模型。