该论文研究在线控制问题,通过使用单一无噪声轨迹计算干扰累积并通过在线梯度下降更新参数,提出了一种数据驱动的策略来减小控制器的后悔。
Aug, 2023
使用基于数据的控制法律,通过高斯过程回归来补偿系统未知的动力学,并基于学习的模型的不确定性来自适应反馈部分的增益,以保证全局有界跟踪误差。
Nov, 2018
研究在线控制未知动态的时变线性系统,在非随机控制模型下,通过研究与通用策略的悔恨界证明了该设置比未知时不变或已知时变动态的设置更具有困难性并给出了算法上界,其中 SLS、Youla 和线性反馈策略类被认为是常见的策略类之一。同时,我们给出了针对干扰响应策略类的高效算法,且证明该算法享有具有时间变化的系统所需要的苛刻更强的适应性悔恨界。
Feb, 2022
该研究提出了一种基于物理信息的机器学习控制方法,用于具有高噪声测量的非线性动态系统。结果表明,该方法在高噪声条件下的非线性动态系统的建模准确性和控制性能方面优于现有的基准方法。
Nov, 2023
研究了具有未知动态的约束线性二次调节器,在数据驱动控制技术中解决了安全和探索之间的紧张关系。提出了一个框架,通过持续的激励进行系统识别,同时通过保证状态和输入约束的满足来维护安全。该框架涉及一种新的方法来合成强健的满足约束的反馈控制器,利用了系统级综合的新开发工具。将统计结果与成本次优性边界相连接,从而给出了关于估计和控制器性能的非渐近保证。
Sep, 2018
通过使用基于迭代学习控制(ILC),时滞相图(TLPP)和高斯过程回归(GPR)的迭代,轨迹优化和参数调整方法,我们开发了一种替代的主动控制系统,该方法可以控制系统的动力学,尽管控制器速度远慢于动力学的速度。我们在 Lorenz 方程组中演示了这个控制器,它通过迭代调整(调谐)系统的输入参数来成功复制所需的振荡轨迹或状态。此外,我们还研究了系统对其控制参数的动态敏感性,识别了期望动态轨迹的连续和有界区域,并证明了只要满足某些要求,控制器对于缺失信息和不可控参数具有鲁棒性。本文提出的控制器为各种快速非线性系统提供了低速控制的框架,可以帮助抑制和减轻不稳定性。
May, 2024
使用 Koopman 算子理论开发了一个基于数据驱动的框架,用于非线性系统的系统识别和线性化控制,采用递归学习的深度学习框架,并使用线性二次控制器对得到的线性系统进行控制。通过在噪声数据上进行仿真,我们展示了我们的方法相比自编码器基准更高效且更准确的训练结果。
Sep, 2023
本研究提出了一种基于物理引导的混合建模方法,通过在传统物理模型的基础上引入循环神经网络并使用复杂的多目标策略进行训练,以生成物理可行的非自治系统模型,进而与物理模型进行比较,在实验数据上取得了显著的准确性提升.
Apr, 2022
本文介绍了一种名为广义动作管制器的监督方案,该方案可以为惯性闭环系统提供强制性处理约束的能力。在介绍其理论为一般系统和为线性和离散系统提供的定制设计方法后,我们讨论了其在安全在线学习中的应用,即旨在使用实时数据安全地演变控制参数以改进不确定系统的性能。特别地,我们提出了两个安全学习算法,这些算法基于增强学习 / 数据驱动 Koopman 运算符控制与广义动作管制器的集成。发展成果可以通过数字实例来说明。
Nov, 2022
该研究论文提出了一种新颖的控制器合成方法,它不需要任何明确表示噪声分布的方式,而是通过将控制系统抽象为捕捉噪声的有限状态模型,然后使用从场景方法中的工具来计算可能正确的限制,基于一些噪声的有限数量样本。通过缩小合成过程的复杂性,该方法在实际控制系统上的应用具有广泛的适用性。
Jan, 2023