Feb, 2021

关于基于预测的在线 LQR 控制算法的后悔分析

TL;DR本文研究在线线性二次调节器(LQR)控制与时变成本函数和干扰的动态后悔。研究了具有有限前瞻窗口的成本函数和干扰情况。本文研究的在线控制算法属于具有特定选择终端成本的模型预测控制(MPC),以保证 MPC 的指数稳定性。证明了这种在线算法的后悔随预测长度的指数级下降。本文还研究了对扰动的不准确预测的影响。