Apr, 2024

一种用于高效合成和验证的基于 Lyapunov 稳定性的神经控制的状态和输出反馈的新方法

TL;DR学习型神经网络控制策略在机器人学和控制领域的广泛任务中显示出令人印象深刻的实证性能,然而,对于具有非线性动力系统的神经网络控制器而言,关于吸引域(ROA)内的 Lyapunov 稳定性保证是具有挑战性的,并且现有的大多数方法都依赖于昂贵的求解器,例如 SOS、MIP 或 SMT。本文提出了一种新的框架,利用快速经验性推翻和战略正则化来学习具有 Lyapunov 证明的 NN 控制器。