从反例和演示中学习控制李雅普诺夫函数

Apr, 2018

从反例和演示中学习控制李雅普诺夫函数

Learning Control Lyapunov Functions from Counterexamples and Demonstrations

Hadi Ravanbakhsh, Sriram Sankaranarayanan

TL;DR本文提出一种学习控制李亚普诺夫函数的技术，通过使用非线性模型预测控制器来分析和优化控制方法，从而在非线性动力学系统的稳定性问题中发挥重要作用。

Abstract

We present a technique for learning control lyapunov-like functions, which are used in turn to synthesize controllers for nonlinear dynamical systems that can stabilize the system, or satisfy specifications such

control lyapunov-like functions nonlinear dynamical systems learning framework verifier convex optimizations

发现论文，激发创造

神经李亚普诺夫控制

本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数，具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器，通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序，以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程，提供了端到端的正确性保证，并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验，展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。

May, 2020

使用强健神经李亚普诺夫障函数的安全非线性控制

本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Sep, 2021

离散时间系统的神经李雅普诺夫控制

提出了一种针对离散时间系统学习神经 Laypunov 控制器的方法，其中包括计算 Lyapunov 控制函数的混合整数线性规划方法、计算子水平集的新方法以及基于启发式梯度的方法以加速学习 Lyapunov 函数。实验结果表明，该方法在四个标准测试中均优于目前的基线方法，并且在车杆和 PVTOL 测试中是第一个自动化控制器的学习方法。

May, 2023

使用自学几乎 Lyapunov 评论家稳定神经控制

本研究提出了一种新的方法利用学习基础算法的神经控制策略和神经 Lyapunov critique 函数，利用采样方法和 Almost Lyapunov 函数条件来增强各种非线性系统的神经控制器的稳定性。

Jul, 2021

分解控制李亚普诺夫函数以实现高效强化学习

使用控制李雅普诺夫函数对强化学习进行奖励重塑并降低样本复杂性，通过分解控制李雅普诺夫函数计算提高了强化学习绩效，在多个示例中成功地在较少的真实数据量下降落四旋翼飞行器。

Mar, 2024

从专家演示中学习控制屏障函数

本文提出一种基于学习的方法来合成安全控制器，该方法基于控制屏障函数，考虑非线性控制仿射动力系统的情况，并假设我们可以访问由专家生成的安全轨迹，在此基础上，提出和分析了基于优化的 CBF 学习方法，其具有可证明的安全保证。

Apr, 2020

从数据中学习稳定证明

我们开发了一种算法，从轨迹数据中学习证明函数。我们从轨迹数据中建立了证明函数，并将其转换为全局稳定性保证，可以应用于其他任务中。

Aug, 2020

分布鲁棒策略与李雅普诺夫证明学习

论文介绍了一种新颖的方法，用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式，确保 Lyapunov 证书的单调减少，解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中，证明了在包括超出分布范围的模型不确定性的情况下，闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中，将该方法与无关不确定性的基准方法和几个强化学习方法进行比较，验证了所提出方法的有效性和高效性。

Apr, 2024

Lyapunov 神经网络：自适应稳定性认证用于动态系统的安全学习

本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法，以学习非线性闭环动力系统的准确安全证明，并在模拟倒立摆中演示了该方法的应用，讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。

Aug, 2018

从演示中学习限制

本论文提出了一种通过 hit-and-run 抽样方法，利用任务演示、成本函数以及系统动力学和控制约束知识，学习跨任务共享的未知约束的方法。该方法可以学习系统动力学的不确定性，学习一定量的约束，并且适用于线性和非线性系统的控制。

Dec, 2018