使用强健神经李亚普诺夫障函数的安全非线性控制

Sep, 2021

使用强健神经李亚普诺夫障函数的安全非线性控制

Safe Nonlinear Control Using Robust Neural Lyapunov-Barrier Functions

Charles Dawson, Zengyi Qin, Sicun Gao, Chuchu Fan

TL;DR本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Abstract

Safety and stability are common requirements for robotic control systems; however, designing safe, stable controllers remains difficult for nonlinear and uncertain models. We develop a model-based learning approach

robotic control systems model-based learning approach robust feedback controllers lyapunov theory simulation

发现论文，激发创造

使用控制李雅普诺夫障碍函数进行安全机器人控制的强化学习

本文研究使用控制李亚普诺夫壁函数（CLBF）来分析安全性和可达性，使用 Lyapunov 壁演员 - 评论家（LBAC）算法进行数据驱动寻找控制器，以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中，实验结果显示了该方法在可达性和安全性方面的优异表现。

May, 2023

使用监督式机器学习方法合成控制屏障函数

该论文描述了一种从传感器数据中估计控制屏障函数的学习框架，经实验证明可以在未知状态空间区域中实现机器人系统的安全操作。

Mar, 2020

具有控制障碍函数的安全关键控制学习

利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性，从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证，这种方法可以持续收集数据并更新控制器，最终实现安全行为。

Dec, 2019

神经李亚普诺夫控制

本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数，具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器，通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序，以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程，提供了端到端的正确性保证，并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验，展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。

May, 2020

具有障碍认证的自适应强化学习及其在 Brushbot 导航中的应用

本文提出了一个安全学习框架，该框架采用自适应模型学习算法以及障碍证书，用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构，并结合控制障碍证书来保持安全。在一定条件下，保证了违反安全性后的 Lypunov 稳定恢复。最终证明了该框架通过仿真和测试的方式，在具有未知、高度复杂和非平稳动态的机器人系统中是有效的。

Jan, 2018

从专家演示中学习控制屏障函数

本文提出一种基于学习的方法来合成安全控制器，该方法基于控制屏障函数，考虑非线性控制仿射动力系统的情况，并假设我们可以访问由专家生成的安全轨迹，在此基础上，提出和分析了基于优化的 CBF 学习方法，其具有可证明的安全保证。

Apr, 2020

Lyapunov 神经网络：自适应稳定性认证用于动态系统的安全学习

本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法，以学习非线性闭环动力系统的准确安全证明，并在模拟倒立摆中演示了该方法的应用，讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。

Aug, 2018

使用控制李雅普诺夫函数和控制阻碍函数的模型不确定性下安全关键控制的强化学习

本文提出了一种基于强化学习框架的方法，利用 CBF、CLF 等约束条件中存在的模型不确定性，并结合标称模型的 CBF-CLF-QP，得到了强化学习驱动的 CBF-CLF-QP，有效解决了安全约束中的模型不确定性问题。实验证明，在一个脚踩随机分布台石的非完全驱动非线性双足机器人上，此方法保证了机器人的安全和稳定行走。

Apr, 2020

一种基于 Barrier-Lyapunov 的 Actor-Critic 强化学习方法，用于安全稳定控制

本文提出了一个基于控制栅函数 (control barrier function, CBF) 和控制李雅普诺夫函数 (control Lyapunov function, CLF) 方法的强化学习 (reinforcement learning, RL) 框架，称之为 Barrier-Lyapunov Actor-Critic (BLAC) 框架，它有助于维护系统的安全性和稳定性。本框架通过基于重放缓冲器中采样的数据构建安全性的控制障碍函数约束和稳定性的控制李雅普诺夫函数约束，并使用增广拉格朗日方法来更新基于 RL 的控制器的参数。此外，本文还引入了一种备份控制器，以防安全和稳定性约束无法同时满足时 RL 控制器不能提供有效的控制信号。仿真结果证明，相对于基线算法，该框架产生的控制器可以帮助系统接近期望状态，并导致更少的安全约束违反。

Apr, 2023

学习混合系统安全控制的本地控制阻碍函数

本文提出一种基于学习的方法，通过构建基于神经网络的 Control Barrier Functions (CBFs) 来确保广泛类别的非线性混合动力系统的安全，从而解决现有方法的计算效率低、对系统性能不利或仅适用于小规模系统的问题。

Jan, 2024