研究了在动态预测控制中,如何应对时间变化的线性动态和成本,提出了动态后悔度和控制竞争度的因果关系,并基于扰动边界提出了一种新的证明框架。
Jun, 2021
本文提出了基于样本的 LMPC 控制器,该控制器适用于受到有界添加干扰的约束不确定线性系统。我们介绍了安全集与价值函数的设计,用于保证安全性和性能改进,并展示了如何使用有噪声的历史数据来近似这些量。数值实例证明了所提出的方法的有效性。我们证明了所提出的 LMPC 能够安全地探索状态空间,迭代地改进最坏情况下闭环性能,同时稳健地满足状态和输入约束。
Apr, 2019
本文研究在线线性二次调节器(LQR)控制与时变成本函数和干扰的动态后悔。研究了具有有限前瞻窗口的成本函数和干扰情况。本文研究的在线控制算法属于具有特定选择终端成本的模型预测控制(MPC),以保证 MPC 的指数稳定性。证明了这种在线算法的后悔随预测长度的指数级下降。本文还研究了对扰动的不准确预测的影响。
Feb, 2021
提出了一种解决具有未知系统模型的线性二次(LQ)控制问题的算法,其遗憾为 O (√T),并在此基础上提出了首个完全自适应的算法,同时控制策略更新次数和自适应地优化遗憾上限,避免了计算复杂性问题。
Jun, 2024
本文提出一种名为 ExpCommit 的算法,用于在未知模型动态的情况下最小化部分可观测线性二次控制系统中的后悔,并提供一种新颖的方式来分解后悔,并为部分可观测线性二次控制系统提供端到端的次线性后悔上界,并对 ExpCommit 提供稳定性保证及后悔上界。
Jan, 2020
对于自适应控制中的预先训练策略,我们研究了一个自适应线性二次控制问题,在这个设置中学习者具有动力学的一组基矩阵的先验知识。我们提出了一种使用这个先验知识的算法,并对通过与系统进行 T 次交互后的预期遗憾给出了上界。
Dec, 2023
本文介绍了一种有效的基于模型预测控制的自适应方法,用于在具有挑战性的非结构化环境中实现自主系统的运行控制,以适应多样的环境和模型不确定性。
Mar, 2023
本文提出了一种自适应控制的方法,可用于处理 Linear Quadratic Regulator 中未知的线性系统和需求预测的问题,算法的时间复杂度为多项式级别,且在控制中有很好的保障。
May, 2018
我们通过设计新的正则化技术,并将其与未经验证的未来成本预测相结合,实现了自适应于环境的 Non-stochastic Control 算法,这些算法通过考虑系统的内存具有新的数据自适应策略回归界限,并能在准确预测时收缩,即使全部失败时仍保持次线性。
Oct, 2023
考虑线性时变动态系统中的控制问题,使用后悔最小化的方法设计在线控制器,通过一个新的降阶到 H∞控制的方法导出了后悔最优控制器的状态空间结构,并给出了能量干扰下的紧密数据相关的后悔上界。
Oct, 2020