Jan, 2020

无限时域可微模型预测控制

TL;DR本文提出了一种可微分的线性二次模型预测控制(MPC)框架,用于安全模仿学习,其中利用从离散时间代数 Riccati 方程(DARE)获得的终端成本函数强制实施无限地平线成本,以便能够证明所学控制器在闭环中稳定。该框架的学习能力在一组数值研究中得到了证明。