一种用于高效合成和验证的基于 Lyapunov 稳定性的神经控制的状态和输出反馈的新方法

Apr, 2024

一种用于高效合成和验证的基于 Lyapunov 稳定性的神经控制的状态和输出反馈的新方法

Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation for Efficient Synthesis and Verification

PDF

Lujie Yang, Hongkai Dai, Zhouxing Shi, Cho-Jui Hsieh, Russ Tedrake...

TL;DR学习型神经网络控制策略在机器人学和控制领域的广泛任务中显示出令人印象深刻的实证性能，然而，对于具有非线性动力系统的神经网络控制器而言，关于吸引域（ROA）内的 Lyapunov 稳定性保证是具有挑战性的，并且现有的大多数方法都依赖于昂贵的求解器，例如 SOS、MIP 或 SMT。本文提出了一种新的框架，利用快速经验性推翻和战略正则化来学习具有 Lyapunov 证明的 NN 控制器。

Abstract

Learning-based neural network (NN) control policies have shown impressive empirical performance in a wide range of tasks in robotics and control. However, formal (Lyapunov) stability guarantees over the region-of-attraction (ROA) for NN controllers with nonlinear dynamical systems are challenging to obtain, and most existing approaches rely on expensive solv

neural network control policies lyapunov stability guarantees verifiable region-of-attraction lyapunov derivatives branch-and-bound nn verification techniques

发现论文，激发创造

神经李亚普诺夫控制

本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数，具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器，通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序，以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程，提供了端到端的正确性保证，并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验，展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。

May, 2020

分布鲁棒策略与李雅普诺夫证明学习

论文介绍了一种新颖的方法，用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式，确保 Lyapunov 证书的单调减少，解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中，证明了在包括超出分布范围的模型不确定性的情况下，闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中，将该方法与无关不确定性的基准方法和几个强化学习方法进行比较，验证了所提出方法的有效性和高效性。

Apr, 2024

使用自学几乎 Lyapunov 评论家稳定神经控制

本研究提出了一种新的方法利用学习基础算法的神经控制策略和神经 Lyapunov critique 函数，利用采样方法和 Almost Lyapunov 函数条件来增强各种非线性系统的神经控制器的稳定性。

Jul, 2021

演员 - 评论员物理告知的神经李雅普诺夫控制

使用 Zubov 的偏微分方程方法训练神经网络控制器和其对应的李亚普诺夫证书，以提高控制策略的吸引域范围。

Mar, 2024

Lyapunov 神经网络：自适应稳定性认证用于动态系统的安全学习

本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法，以学习非线性闭环动力系统的准确安全证明，并在模拟倒立摆中演示了该方法的应用，讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。

Aug, 2018

使用强健神经李亚普诺夫障函数的安全非线性控制

本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Sep, 2021

离散时间系统的神经李雅普诺夫控制

提出了一种针对离散时间系统学习神经 Laypunov 控制器的方法，其中包括计算 Lyapunov 控制函数的混合整数线性规划方法、计算子水平集的新方法以及基于启发式梯度的方法以加速学习 Lyapunov 函数。实验结果表明，该方法在四个标准测试中均优于目前的基线方法，并且在车杆和 PVTOL 测试中是第一个自动化控制器的学习方法。

May, 2023

元学习基于自适应稳定证书的动态系统

本文研究了神经网络在动态系统中的自适应稳定性认证问题，提出了与参数不确定性相关的神经李雅普诺夫函数的方法，通过与模型无关元学习的整合，提出了元神经李雅普诺夫函数，以应对参数变化带来的稳定性评估性能下降的问题。通过在标准基准自主动态系统上验证，证明了元神经李雅普诺夫函数在稳定性评估方面的性能。

Dec, 2023

神经网络控制自主系统的形式化验证

本文考虑了使用神经网络控制器的自主机器人的安全性问题。通过构建系统的一个有限状态抽象并使用标准的可达性分析方法，计算出一组安全的初始状态，使得从这些初始状态开始的机器人轨迹能够避开多面体障碍物。

Oct, 2018

利用高斯过程学习不确定非线性系统的吸引区域保证

本文利用控制理论和高斯过程模型设计了一种利用实验数据学习非线性系统吸引子区域的方法，能够在保障安全的前提下主动扩展其吸引区域的估计值。

Mar, 2016