Apr, 2024

基于稳定性信息的贝叶斯优化用于 MPC 成本函数学习

TL;DR设计预测控制器以实现闭环性能最优化,同时保持安全和稳定性是具有挑战性的。本文通过在考虑闭环稳定性的情况下,利用受限贝叶斯优化来学习预测控制参数,将成本函数参数化为前馈神经网络,并进行闭环行为和模型 - 过程不匹配的最小化,从而提供了高自由度和有效全局优化实现期望的闭环行为。我们通过学习控制器参数的稳定性约束扩展了这个框架,并利用底层 MPC 的最优值函数作为一个 Lyapunov 候选。模拟结果验证了所提出方法的有效性,突显了其性能和安全能力。