本文探讨了如何使用单个学习算法共同学习证明其稳定性的證明的策略,结果显示需要对策略进行某种形式的预训练才能成功修复和验证策略。
May, 2022
时间序列聚类是一个研究深入的问题,本文提出了一种变体方法,在给定一组轨迹和一定数量的部分的情况下,共同划分轨迹集并学习每个部分的线性动态系统(LDS)模型,以最小化所有模型的最大误差,给出了全局收敛方法和 EM 启发式算法,并伴随着有希望的计算结果。
Nov, 2023
研究模型基于的强化学习在未知可稳定线性动态系统中的应用,提出一种通过改进探索策略证明基本稳定性的算法,所提出的算法在避免系统崩溃的同时,实现了对环境的快速探索,在多个自适应控制任务中表现优异。
Jul, 2020
针对多维线性系统的自适应稳定化问题,该研究提出了一种确知等效控制方案,该方案将在线参数估计与饱和线性控制相结合,证明了在系统及噪声假设条件下,闭环系统具有高概率稳定性界限,并给出了数值实验结果。
Apr, 2023
本研究主要集中于一种操作器推理方法,旨在基于先验假设构建基于低维度动力学模型,这些假设通常基于已建立的物理学或专家见解。我们的主要目标是开发一种能够推断具有固有稳定性保证的二次控制动力学系统的方法。我们研究具有能量保持非线性的控制系统的稳定性特征,从而识别出这些系统在什么条件下是有界输入有界状态稳定的。随后,这些见解被应用于学习过程,从而产生设计上固有稳定的推断模型。我们通过几个数值示例来验证我们提出的框架的有效性。
Mar, 2024
通过将非线性系统的内部模型控制原理与最先进的无约束优化方法相结合,我们解决了数据驱动和深度学习方法提高性能的问题,同时保证闭环稳定性。我们的方法可以学习稳定非线性系统上任意深的神经网络控制器,即使优化过早停止,即使未知基准动态,也能保证 Lp 闭环稳定性。我们通过多个数值实验讨论了所提出控制方案的实施细节,包括分布式方案和对应的优化过程,并展示了通过自由塑造代价函数的潜力。
May, 2024
基于机器学习方法的控制研究现已过渡到实际工程阶段。本文提出了一种学习方法,用于确保系统的稳定性、可靠性等方面,为各种控制理论提供了高度的自由度,以实现高性能和理论上的安全性。通过将简单线性控制与控制屏障函数相结合,展示了一个设计示例,并将其应用于汽车发动机的实时控制,实验结果表明具有良好的预测性能和稳定的控制能力。
通过提出一种主动学习的方法,该方法不断进行轨迹规划,轨迹跟踪和重新估计系统,并展示了该方法以参数速率估计非线性动态系统,类似于标准线性回归的统计速率。
Jun, 2020
该研究提出了一种从观察多种系统动态下的轨迹中学习线性系统模型的算法,其中系统根据相似性被分为不同的簇,并推导出一种通过估计系统簇身份并估计动态来更新每个簇模型的方法,从而实现更高效和个性化的系统识别过程。
本文提出了一种稳定学习动态系统的方法,该方法采用联合学习动态模型和李雅普诺夫函数的方法,这样学习的系统在整个状态空间内保持稳定,同时它也能够被结合到其他深度生成模型中学习复杂的动态系统,例如视觉纹理。
Jan, 2020