使用障碍证明实现四旋翼动力学的安全学习

Oct, 2017

使用障碍证明实现四旋翼动力学的安全学习

Safe Learning of Quadrotor Dynamics Using Barrier Certificates

Li Wang, Evangelos A. Theodorou, Magnus Egerstedt

TL;DR该论文提出基于高斯过程的数据驱动方法，学习部分未知环境下四旋翼的模型，采用屏障证明方法确保学习过程的安全，并设计了学习控制器以及递归高斯过程预测方法，模拟结果表明该方法的有效性。

Abstract

To effectively control complex dynamical systems, accurate nonlinear models are typically needed. However, these models are not always known. In this paper, we present a data-driven approach based on

nonlinear models data-driven approach gaussian processes barrier certificates quadrotors

发现论文，激发创造

基于数据驱动的带屏障证书容许安全控制

通过使用障碍证明方法，结合高斯过程回归，本文介绍了一种从具备未知动力学的随机系统数据中鉴定出一组最大安全策略的方法。通过学习系统动力学并得到该预估的概率误差，我们开发了一种算法来构建分段随机障碍函数，从而利用学习到的高斯过程模型找到一组最大允许的策略集，该集合通过有序地剔除最糟糕的控制策略直至得到最大集合，保证了真实系统的概率安全性。这对于学习能力系统而言尤为重要，因为丰富的策略空间不仅可以增加数据采集，还能保持安全性并展现复杂行为。线性和非线性系统的案例研究表明，扩大用于学习系统的数据集大小能够增加最大允许的策略集。

Apr, 2024

具有障碍认证的自适应强化学习及其在 Brushbot 导航中的应用

本文提出了一个安全学习框架，该框架采用自适应模型学习算法以及障碍证书，用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构，并结合控制障碍证书来保持安全。在一定条件下，保证了违反安全性后的 Lypunov 稳定恢复。最终证明了该框架通过仿真和测试的方式，在具有未知、高度复杂和非平稳动态的机器人系统中是有效的。

Jan, 2018

初始化未知模型和不可行安全证书下的安全在线动态学习

通常，学习和控制过程中利用约束安全证书的技术被用于保证安全性，但是过高的模型不确定性可能使得鲁棒安全认证方法变得不可行。本文考虑了基于控制屏障函数（CBF）二阶锥规划的具有鲁棒安全证书的学习环境，在该环境下，如果控制屏障函数证书是可行的，我们的方法将利用它来保证安全性。否则，我们的方法通过探索系统动力学来收集数据，恢复控制屏障函数约束的可行性。我们采用了一种受贝叶斯优化中成熟工具启发的方法。我们证明，如果采样频率足够高，我们可以恢复鲁棒 CBF 证书的可行性，从而保证安全性。我们的方法不需要先验模型，据我们所知，这是第一个在存在偶尔不可行安全证书的情况下无需备份非学习型控制器即可保证安全的算法。

Nov, 2023

安全控制策略的神经证书

本文提出一种方法，通过联合学习障碍函数和类李亚普诺夫函数的神经网络来实现动态系统的安全和目标控制，该方法在摆、小车倒立杆和无人机等动态系统中得到了有效应用。

Jun, 2020

通过学习深度逆动力学模型进行安全控制器的转移

通过将源系统的控制障碍证书与目标系统的逆动力学神经网络进行整合，我们提出了一种验证控制器正确性的新方法，并通过三个案例研究证明了其有效性。

May, 2024

SABLAS: 黑箱动态系统安全控制学习

本文提出了一种新的方法，用于从黑盒动态系统中学习安全控制策略和屏障证书，无需精确的系统模型，并证明了安全证书在黑盒系统上成立。

Jan, 2022

基于数据的安全证书的可伸缩合成及其在基于学习的控制中的应用

本文提出了有效的技术来综合安全集合和控制律，通过基于凸优化问题的近似来提供改进的可伸缩性质，其中一种方法仅需要近似的线性系统模型和 Lipschitz 连续的未知非线性动力学，展示了数字示例，包括一个自主车队。

Nov, 2017

基于高斯过程的四旋翼安全控制优化

本文介绍一种为解决调参过程可能导致的安全失败问题而开发的安全优化算法 ——SafeOpt，该算法通过将性能度量建模为高斯过程并探索高于安全性能阈值的新控制器参数来自动优化控制器参数，以实现快速、自动和安全的控制器参数优化，实验数据表明该方法可以在不需要人工干预的情况下快速、自动、安全地优化控制器参数。

Sep, 2015

高阶不确定模型中的实时自适应安全关键控制与高斯过程

本文提出了一种适应不确定参数系统的自适应在线学习框架，以确保非平稳环境下的安全临界控制；该方法包括两个阶段，第一阶段基于稀疏高斯过程算法改进，第二阶段提出了基于高阶控制屏障函数的安全过滤器与学习模型相结合，并通过实时障碍物避免实验证明了算法的有效性。

Feb, 2024

使用强健神经李亚普诺夫障函数的安全非线性控制

本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Sep, 2021