本研究中,我们研究了在线控制下的线性动态系统在拥有转移动态知识的拥有敌意的变化强凸成本函数下的最优遗憾界限,并提出了在线梯度下降和在线自然梯度两种不同且高效的迭代方法来实现遗憾边界小而有效。
Sep, 2019
本研究解决了分布式在线控制问题,考虑了存在对抗干扰的线性时不变系统网络。针对已知动态和未知动态两种情况,分别提出了全分布式干扰反馈控制器和探索 - 执行方法,并给出了相应的遗憾界。
Oct, 2023
该论文研究在线控制问题,通过使用单一无噪声轨迹计算干扰累积并通过在线梯度下降更新参数,提出了一种数据驱动的策略来减小控制器的后悔。
Aug, 2023
研究了在动态预测控制中,如何应对时间变化的线性动态和成本,提出了动态后悔度和控制竞争度的因果关系,并基于扰动边界提出了一种新的证明框架。
Jun, 2021
研究了具有时间变化凸阶段成本的在线最优控制问题,设计了利用有限的梯度计算的 RHGC 算法,证明了其动态遗憾随着前瞻窗口大小的指数级下降,并利用线性二次跟踪问题提供了任何在线算法的动态遗憾的基本限制,最后用数值测试证明了 RHGC 算法在线性和非线性系统上的有效性和普适性。
Jun, 2019
研究在线控制未知动态的时变线性系统,在非随机控制模型下,通过研究与通用策略的悔恨界证明了该设置比未知时不变或已知时变动态的设置更具有困难性并给出了算法上界,其中 SLS、Youla 和线性反馈策略类被认为是常见的策略类之一。同时,我们给出了针对干扰响应策略类的高效算法,且证明该算法享有具有时间变化的系统所需要的苛刻更强的适应性悔恨界。
Feb, 2022
本文研究带有敌对干扰的线性动态系统的控制,在几乎不知道扰动信息的情况下,实现近乎最优的在线控制过程,主要贡献是提出一种算法来提供几乎紧密的遗憾界,这一研究在技术层面上对以前的工作进行了推广和扩展。
Feb, 2019
该研究针对未知的非线性动态系统问题,提出了一种基于再生核希尔伯特空间的顺序控制算法,并通过信息理论量来获得近乎最优的遗憾上界,实验结果表明其在多个非线性控制任务中均获得了较好的表现。
Jun, 2020
适应性代理、在线控制、后悔最小化、对抗性干扰、表现性预测是该研究论文的主要关键词,该论文提出了一个统一的算法框架,用于在预测和优化可能的代理响应空间中实现可计算的后悔最小化,同时说明了在各种情况下的的紧界限制以及应用实例。
Jun, 2024
本文针对已知系统且受到敌对扰动的情况下,介绍了新的在线线性二次控制算法,通过将在线控制问题转化为具有近似优越函数的(延迟的)在线学习,无需控制迭代的运动成本,从而提高了算法的效果。
Feb, 2020