自适应模型预测控制中的亚线性遗憾

Oct, 2023

自适应模型预测控制中的亚线性遗憾

Sub-linear Regret in Adaptive Model Predictive Control

Damianos Tranos, Alexandre Proutiere

TL;DR自适应模型预测控制算法 (STT-MPC) 结合了等价原理和多面体管的在线算法，以稳定系统状态和输入的限制条件并解决不确定线性系统问题。

Abstract

We consider the problem of adaptive model predictive control (MPC) for uncertain linear-systems with additive disturbances and with state

adaptive model predictive control uncertain linear-systems additive disturbances state and input constraints polytopic tubes

发现论文，激发创造

线性时变系统中基于扰动的预测控制遗憾分析

研究了在动态预测控制中，如何应对时间变化的线性动态和成本，提出了动态后悔度和控制竞争度的因果关系，并基于扰动边界提出了一种新的证明框架。

Jun, 2021

基于样本的线性不确定系统模型预测控制

本文提出了基于样本的 LMPC 控制器，该控制器适用于受到有界添加干扰的约束不确定线性系统。我们介绍了安全集与价值函数的设计，用于保证安全性和性能改进，并展示了如何使用有噪声的历史数据来近似这些量。数值实例证明了所提出的方法的有效性。我们证明了所提出的 LMPC 能够安全地探索状态空间，迭代地改进最坏情况下闭环性能，同时稳健地满足状态和输入约束。

Apr, 2019

关于基于预测的在线 LQR 控制算法的后悔分析

本文研究在线线性二次调节器（LQR）控制与时变成本函数和干扰的动态后悔。研究了具有有限前瞻窗口的成本函数和干扰情况。本文研究的在线控制算法属于具有特定选择终端成本的模型预测控制（MPC），以保证 MPC 的指数稳定性。证明了这种在线算法的后悔随预测长度的指数级下降。本文还研究了对扰动的不准确预测的影响。

Feb, 2021

线性二次系统控制的全自适应保证后悔算法

提出了一种解决具有未知系统模型的线性二次（LQ）控制问题的算法，其遗憾为 O (√T)，并在此基础上提出了首个完全自适应的算法，同时控制策略更新次数和自适应地优化遗憾上限，避免了计算复杂性问题。

Jun, 2024

部分可观察线性二次控制中的遗憾最小化

本文提出一种名为 ExpCommit 的算法，用于在未知模型动态的情况下最小化部分可观测线性二次控制系统中的后悔，并提供一种新颖的方式来分解后悔，并为部分可观测线性二次控制系统提供端到端的次线性后悔上界，并对 ExpCommit 提供稳定性保证及后悔上界。

Jan, 2020

自适应线性二次控制的非渐进遗憾分析及模型误差

对于自适应控制中的预先训练策略，我们研究了一个自适应线性二次控制问题，在这个设置中学习者具有动力学的一组基矩阵的先验知识。我们提出了一种使用这个先验知识的算法，并对通过与系统进行 T 次交互后的预期遗憾给出了上界。

Dec, 2023

使用管道 Model Predictive Control 引导的数据增强，高效学习鲁棒性和适应性策略的深度学习

本文介绍了一种有效的基于模型预测控制的自适应方法，用于在具有挑战性的非结构化环境中实现自主系统的运行控制，以适应多样的环境和模型不确定性。

Mar, 2023

线性二次型调节器的鲁棒自适应控制遗憾界

本文提出了一种自适应控制的方法，可用于处理 Linear Quadratic Regulator 中未知的线性系统和需求预测的问题，算法的时间复杂度为多项式级别，且在控制中有很好的保障。

May, 2018

自适应在线非随机控制

我们通过设计新的正则化技术，并将其与未经验证的未来成本预测相结合，实现了自适应于环境的 Non-stochastic Control 算法，这些算法通过考虑系统的内存具有新的数据自适应策略回归界限，并能在准确预测时收缩，即使全部失败时仍保持次线性。

Oct, 2023

动态环境下的遗憾最优控制

考虑线性时变动态系统中的控制问题，使用后悔最小化的方法设计在线控制器，通过一个新的降阶到 H∞控制的方法导出了后悔最优控制器的状态空间结构，并给出了能量干扰下的紧密数据相关的后悔上界。

Oct, 2020