Jun, 2019

基于线性动力学和预测的在线最优控制:算法及遗憾分析

TL;DR研究了具有时间变化凸阶段成本的在线最优控制问题,设计了利用有限的梯度计算的 RHGC 算法,证明了其动态遗憾随着前瞻窗口大小的指数级下降,并利用线性二次跟踪问题提供了任何在线算法的动态遗憾的基本限制,最后用数值测试证明了 RHGC 算法在线性和非线性系统上的有效性和普适性。