有限时间自适应 LQ 系统稳定化

Jul, 2018

Finite Time Adaptive Stabilization of LQ Systems

Mohamad Kazem Shirani Faradonbeh, Ambuj Tewari, George Michailidis

TL;DR利用随机线性反馈的新方法，本文针对具有未知动态的线性系统稳定问题，通过随机方法提供了稳定的有限时间概率保证。

Abstract

stabilization of linear systems with unknown dynamics is a canonical problem in adaptive control. Since the lack of knowledge of system parameters can cause it to become destabilized, an adaptive →

adaptive control stabilization finite time random linear feedbacks noise distribution

发现论文，激发创造

不稳定线性系统的有限时间辨识

该研究针对不稳定线性系统的参数识别问题进行了研究，建立了针对重尾噪声分布和转移矩阵的一类较大误差最小二乘估计的有限时间界限，并与问题维度和真实转移矩阵的关键特征及噪声分布函数的性质相关联，并使用随机矩阵和鞅差序列的适当浓度不等式来实现这些结果。

Oct, 2017

基于学习的自适应控制离散多维随机线性系统稳定性界限及输入限制

针对多维线性系统的自适应稳定化问题，该研究提出了一种确知等效控制方案，该方案将在线参数估计与饱和线性控制相结合，证明了在系统及噪声假设条件下，闭环系统具有高概率稳定性界限，并给出了数值实验结果。

Apr, 2023

一个 Q 学习算法用于具有随机未知分布参数的离散时间线性二次控制：收敛和稳定性

本文针对离散时间线性系统和二次标准的随机参数情况，提出一种基于 Q-learning 精神的在线迭代算法来求解这个无限时间视角下的最优控制问题。第一定理证明了学习序列的收敛性、控制问题的良态性和代数 Riccati 方程的解的可解性三个属性的等价性。第二定理证明了在控制问题得到良态的前提下，学习序列的自适应反馈控制可以稳定系统。数值例子用于说明我们算法的可行性及有效性。

Nov, 2020

基于乐观主义的线性二次系统自适应调节

本文针对线性二次系统的自适应控制过程中参数辨识与控制权衡的问题，提出了一种基于乐观偏置优化（optimism-based）的自适应控制方法。通过采用一些新的技术手段，本文对于重尾分布的随机矩阵的概率行为进行了综合处理，证明了该方法在半末态下的高概率上界是最优的，而且不需要做出过强的假设条件。

Nov, 2017

线性动态系统的黑箱控制

研究使用单个黑盒交互控制未知的线性时不变动态系统的问题，探讨在线非随机控制的情况下如何获得次线性后悔量，该方法可处理对抗性干扰及凸损失函数的变化。我们提供了一种新的系统识别方法，并在一些条件下给出了后悔上界以及结果的匹配性下界。

Jul, 2020

时间序列中参数估计的同步和自适应控制应用

本文介绍了一种通过非线性动力系统中单变量时间序列来估计未知参数的技术，该技术采用两种不同的控制方法，线性反馈和自适应控制，可以即使当未知参数出现在除所给的时间序列之外的其他变量的演化方程式中时也能工作。本技术不仅确认了关于所有系统变量和参数的显式详细信息都包含在一个标量时间序列中，而且还提供了在适当条件下提取出这些信息的方法。最后，本文给出了实例并研究了噪声的影响。

Mar, 1998

随机系统辨识的有限样本分析

本文探讨了使用现代机器学习和统计学工具分析随机系统识别的有限样本复杂性，使用子空间识别算法和 N 个输出样本提供了系统参数估计误差的非渐近高概率上界。

Mar, 2019

含二次非线性控制系统的稳定认证学习

本研究主要集中于一种操作器推理方法，旨在基于先验假设构建基于低维度动力学模型，这些假设通常基于已建立的物理学或专家见解。我们的主要目标是开发一种能够推断具有固有稳定性保证的二次控制动力学系统的方法。我们研究具有能量保持非线性的控制系统的稳定性特征，从而识别出这些系统在什么条件下是有界输入有界状态稳定的。随后，这些见解被应用于学习过程，从而产生设计上固有稳定的推断模型。我们通过几个数值示例来验证我们提出的框架的有效性。

Mar, 2024

线性切换控制中的非渐进标识的最小二乘方法

在已知部分观测的线性动态系统属于已知候选模型的有限集合的情况下，本文关注线性系统识别问题。我们首先考虑了给定轨迹的识别问题，利用线性最小二乘方法的最新非渐近分析进展来表征这个问题的有限时间样本复杂性，并设计了一个维度无关样本复杂性界的学习器。接下来，我们考虑了线性系统的切换控制问题，其中每个候选模型都有一个候选控制器，并通过系统与一组潜在的破坏性控制器的交互来收集数据，我们开发了一个维度相关的准则来在有限时间内检测这些破坏性控制器。我们利用这些结果提出了一个数据驱动的切换策略来识别潜在系统的未知参数，并对其性能进行了非渐近分析，并讨论了其对基于估计的监督控制方法的影响。

Apr, 2024

未知时变动态系统的在线控制

研究在线控制未知动态的时变线性系统，在非随机控制模型下，通过研究与通用策略的悔恨界证明了该设置比未知时不变或已知时变动态的设置更具有困难性并给出了算法上界，其中 SLS、Youla 和线性反馈策略类被认为是常见的策略类之一。同时，我们给出了针对干扰响应策略类的高效算法，且证明该算法享有具有时间变化的系统所需要的苛刻更强的适应性悔恨界。

Feb, 2022