Feb, 2024

无界退化噪声下的在线线性系统控制

TL;DR对于具有未知成本函数和可能无界和退化噪声的线性系统控制问题,本文研究了在线控制问题。通过研究发现,对于凸代价函数,即使存在无界噪声,也可以达到约等于 O (根号 T) 的后悔界,其中 T 是时间跨度。此外,当成本函数是强凸时,在文献中需要的噪声协方差非退化假设下,我们得到了约等于 O (多项式 (log T)) 的后悔界。去除对噪声秩的假设的关键是与噪声协方差相关的系统变换,这同时实现了在线控制算法的参数减少。