演员 - 评论员物理告知的神经李雅普诺夫控制

Mar, 2024

演员 - 评论员物理告知的神经李雅普诺夫控制

Actor-Critic Physics-informed Neural Lyapunov Control

Jiarui Wang, Mahyar Fazlyab

TL;DR使用 Zubov 的偏微分方程方法训练神经网络控制器和其对应的李亚普诺夫证书，以提高控制策略的吸引域范围。

Abstract

Designing control policies for stabilization tasks with provable guarantees is a long-standing problem in nonlinear control. A crucial performance metric is the size of the resulting →

control policies stabilization tasks region of attraction neural network controller lyapunov certificate

发现论文，激发创造

使用自学几乎 Lyapunov 评论家稳定神经控制

本研究提出了一种新的方法利用学习基础算法的神经控制策略和神经 Lyapunov critique 函数，利用采样方法和 Almost Lyapunov 函数条件来增强各种非线性系统的神经控制器的稳定性。

Jul, 2021

神经李亚普诺夫控制

本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数，具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器，通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序，以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程，提供了端到端的正确性保证，并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验，展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。

May, 2020

带稳定性保证的演员 - 评论家强化学习控制

使用经典控制理论中的 Lyapunov 方法，为控制系统提供稳定性保证的 actor-critic RL 框架，确保在一定程度的不确定性干扰下，学习到的策略使得系统能够恢复到平衡或航点。

Apr, 2020

一种用于高效合成和验证的基于 Lyapunov 稳定性的神经控制的状态和输出反馈的新方法

学习型神经网络控制策略在机器人学和控制领域的广泛任务中显示出令人印象深刻的实证性能，然而，对于具有非线性动力系统的神经网络控制器而言，关于吸引域（ROA）内的 Lyapunov 稳定性保证是具有挑战性的，并且现有的大多数方法都依赖于昂贵的求解器，例如 SOS、MIP 或 SMT。本文提出了一种新的框架，利用快速经验性推翻和战略正则化来学习具有 Lyapunov 证明的 NN 控制器。

Apr, 2024

物理信息神经网络李雅普诺夫函数：PDE 特征、学习和验证

利用物理相关的神经网络计算李雅普诺夫函数，将李雅普诺夫条件编码为偏微分方程，并使用神经网络函数进行训练，分析了李雅普诺夫和祖博夫偏微分方程的解的解析性质，提供了可以通过可满足性求解器轻松验证的学习到的神经网络李雅普诺夫函数的充分条件，使得局部稳定分析和吸引域估计能在大范围内进行正式验证，通过多个非线性示例说明所提出的框架可以优于使用半定规划获得的传统的和式李雅普诺夫函数。

Dec, 2023

分布鲁棒策略与李雅普诺夫证明学习

论文介绍了一种新颖的方法，用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式，确保 Lyapunov 证书的单调减少，解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中，证明了在包括超出分布范围的模型不确定性的情况下，闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中，将该方法与无关不确定性的基准方法和几个强化学习方法进行比较，验证了所提出方法的有效性和高效性。

Apr, 2024

Lyapunov 神经网络：自适应稳定性认证用于动态系统的安全学习

本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法，以学习非线性闭环动力系统的准确安全证明，并在模拟倒立摆中演示了该方法的应用，讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。

Aug, 2018

离散时间系统的神经李雅普诺夫控制

提出了一种针对离散时间系统学习神经 Laypunov 控制器的方法，其中包括计算 Lyapunov 控制函数的混合整数线性规划方法、计算子水平集的新方法以及基于启发式梯度的方法以加速学习 Lyapunov 函数。实验结果表明，该方法在四个标准测试中均优于目前的基线方法，并且在车杆和 PVTOL 测试中是第一个自动化控制器的学习方法。

May, 2023

随机系统中区域稳定控制策略的学习

论文研究了在随机系统中学习控制策略的问题，提出了新的稳定排名超级鞅（sRSMs）概念，并介绍了一个可以学习控制策略和 sRSMs 的学习过程，实验结果表明该过程可以成功地学习稳定性证明策略。

Oct, 2022

安全控制策略的神经证书

本文提出一种方法，通过联合学习障碍函数和类李亚普诺夫函数的神经网络来实现动态系统的安全和目标控制，该方法在摆、小车倒立杆和无人机等动态系统中得到了有效应用。

Jun, 2020