Feb, 2024

强化学习与集成模型预测安全认证

TL;DR本文提出了一种名为集成模型预测安全认证的新算法,该算法结合了基于模型的深度强化学习和基于管道的模型预测控制,通过计划对学习代理所采取的行动进行修正,使安全约束违规最小化。我们的方法旨在通过仅需要由安全控制器生成的离线数据,尽量减少对实际系统的先验知识。我们的结果表明,与可比较的强化学习方法相比,我们可以实现显著减少的约束违规。