LQR 控制中线性控制器的威力
本文研究在线线性二次调节器(LQR)控制与时变成本函数和干扰的动态后悔。研究了具有有限前瞻窗口的成本函数和干扰情况。本文研究的在线控制算法属于具有特定选择终端成本的模型预测控制(MPC),以保证 MPC 的指数稳定性。证明了这种在线算法的后悔随预测长度的指数级下降。本文还研究了对扰动的不准确预测的影响。
Feb, 2021
本文提出了一种自适应控制的方法,可用于处理 Linear Quadratic Regulator 中未知的线性系统和需求预测的问题,算法的时间复杂度为多项式级别,且在控制中有很好的保障。
May, 2018
我们研究了控制具有已知嘈杂动力学和对抗选择二次损失的线性时不变系统的问题,并提出了第一种在这种情况下保证 O(sqrt(T))遗憾的有效在线学习算法。我们的算法依赖于对系统稳态分布的新型 SDP 松弛。与以前提出的松弛相反,我们的 SDP 的可行解都对应于 “强稳定” 策略,这些策略混合到稳定状态的速度呈指数增长。
Jun, 2018
在处理未知真实系统参数的在线自适应控制问题中,使用新的上下界结论证明误差的最优性跟时间步数,输入空间和系统状态空间的维度呈现为~(T*d_u^2*d_x)^1/2, 并引入自绑定 ODE 方法控制 Riccati 方程扰动,从而实现任意可控系统实例的回归上界。同时,提出对估计的系统动力学进行合成的确定性等效控制器。
Jan, 2020
本文针对已知系统且受到敌对扰动的情况下,介绍了新的在线线性二次控制算法,通过将在线控制问题转化为具有近似优越函数的(延迟的)在线学习,无需控制迭代的运动成本,从而提高了算法的效果。
Feb, 2020
本研究引入了一种新的连续控制问题设置,称为 RichLQR,使用低维连续潜在状态和高维非线性观测来实现样本高效的学习,并建立了一种新算法 RichID,该算法无需了解编码器的具体信息,仅使用最小二乘回归预测即可实现近似最优控制。
Oct, 2020
研究使用单个黑盒交互控制未知的线性时不变动态系统的问题,探讨在线非随机控制的情况下如何获得次线性后悔量,该方法可处理对抗性干扰及凸损失函数的变化。我们提供了一种新的系统识别方法,并在一些条件下给出了后悔上界以及结果的匹配性下界。
Jul, 2020
本文介绍了一种新的无模型算法,用于控制线性二次系统,利用 reduce 方法,将马尔科夫决策过程的控制问题转化为专家预测问题,该算法实现简单通用,拥有多项理论保证和良好的性能。
Apr, 2018