带敌对扰动的在线控制
本研究中,我们研究了在线控制下的线性动态系统在拥有转移动态知识的拥有敌意的变化强凸成本函数下的最优遗憾界限,并提出了在线梯度下降和在线自然梯度两种不同且高效的迭代方法来实现遗憾边界小而有效。
Sep, 2019
该研究提出了一种针对未知线性动态系统进行控制的方法,能够对抗敌意干扰和对抗凸损失功能,通过衡量后效性的最佳线性策略,实现更高效的算法,并在此设定下保证次线性的遗憾边界 T^{2/3}。
Nov, 2019
本文研究非随机控制问题,提出了一种基于降噪观测值的控制器参数化方法,通过在线梯度下降方法得到一个新的控制器,其对一类闭环策略实现了次线性遗憾,为非随机控制领域中第一个可以与所有线性稳定动态控制器竞争的遗憾界。
Jan, 2020
本文针对已知系统且受到敌对扰动的情况下,介绍了新的在线线性二次控制算法,通过将在线控制问题转化为具有近似优越函数的(延迟的)在线学习,无需控制迭代的运动成本,从而提高了算法的效果。
Feb, 2020
本文研究了控制具有对抗扰动的线性动态系统的问题,其中控制器仅有可用的标量损失反馈,且损失函数本身未知。针对这个问题,无论系统是否知道,我们都提出了一个有效的次线性后悔算法,并提出了一种用于带有记忆的损失函数的通用带贝叶斯优化算法,这可能是独立学科领域的一个难点。
Aug, 2020
研究在线控制未知动态的时变线性系统,在非随机控制模型下,通过研究与通用策略的悔恨界证明了该设置比未知时不变或已知时变动态的设置更具有困难性并给出了算法上界,其中SLS、Youla和线性反馈策略类被认为是常见的策略类之一。同时,我们给出了针对干扰响应策略类的高效算法,且证明该算法享有具有时间变化的系统所需要的苛刻更强的适应性悔恨界。
Feb, 2022
本研究解决了分布式在线控制问题,考虑了存在对抗干扰的线性时不变系统网络。针对已知动态和未知动态两种情况,分别提出了全分布式干扰反馈控制器和探索-执行方法,并给出了相应的遗憾界。
Oct, 2023
对于具有未知成本函数和可能无界和退化噪声的线性系统控制问题,本文研究了在线控制问题。通过研究发现,对于凸代价函数,即使存在无界噪声,也可以达到约等于O(根号T)的后悔界,其中T是时间跨度。此外,当成本函数是强凸时,在文献中需要的噪声协方差非退化假设下,我们得到了约等于O(多项式(log T))的后悔界。去除对噪声秩的假设的关键是与噪声协方差相关的系统变换,这同时实现了在线控制算法的参数减少。
Feb, 2024