Jan, 2020
无限时域可微模型预测控制
Infinite-Horizon Differentiable Model Predictive Control
Sebastian East, Marco Gallieri, Jonathan Masci, Jan Koutnik, Mark Cannon
TL;DR本文提出了一种可微分的线性二次模型预测控制(MPC)框架,用于安全模仿学习,其中利用从离散时间代数 Riccati 方程(DARE)获得的终端成本函数强制实施无限地平线成本,以便能够证明所学控制器在闭环中稳定。该框架的学习能力在一组数值研究中得到了证明。