基于数据驱动的带屏障证书容许安全控制

Apr, 2024

基于数据驱动的带屏障证书容许安全控制

Data-Driven Permissible Safe Control with Barrier Certificates

Rayan Mazouz, John Skovbekk, Frederik Baymler Mathiesen, Eric Frew, Luca Laurenti...

TL;DR通过使用障碍证明方法，结合高斯过程回归，本文介绍了一种从具备未知动力学的随机系统数据中鉴定出一组最大安全策略的方法。通过学习系统动力学并得到该预估的概率误差，我们开发了一种算法来构建分段随机障碍函数，从而利用学习到的高斯过程模型找到一组最大允许的策略集，该集合通过有序地剔除最糟糕的控制策略直至得到最大集合，保证了真实系统的概率安全性。这对于学习能力系统而言尤为重要，因为丰富的策略空间不仅可以增加数据采集，还能保持安全性并展现复杂行为。线性和非线性系统的案例研究表明，扩大用于学习系统的数据集大小能够增加最大允许的策略集。

Abstract

This paper introduces a method of identifying a maximal set of safe strategies from data for stochastic systems with unknown dynamics using barrier certificates. The first step is learning the dynamics of the sys

safe strategies stochastic systems unknown dynamics barrier certificates gaussian process regression

发现论文，激发创造

有限时间随机系统的障碍函数方法进行验证和控制

研究 stochastic dynamical system 在 finite-time horizon 下的安全性问题，提出基于 stochastic control barrier functions 的 barrier certificate condition 以量化系统在有限时间内退出给定的安全区域的概率，并将该条件表述为 sum-of-squares 优化问题进行高效的数值计算，在保证 expected value 的发展的状态相关的上限的前提下，提供了连续时间和离散时间系统的解决方案，针对控制的仿射动力学系统，提出了合成多项式状态反馈控制器以实现指定的安全概率，使用实例研究连续时间和离散时间领域中验证和控制方法的性能。

Sep, 2019

使用障碍证明实现四旋翼动力学的安全学习

该论文提出基于高斯过程的数据驱动方法，学习部分未知环境下四旋翼的模型，采用屏障证明方法确保学习过程的安全，并设计了学习控制器以及递归高斯过程预测方法，模拟结果表明该方法的有效性。

Oct, 2017

SABLAS: 黑箱动态系统安全控制学习

本文提出了一种新的方法，用于从黑盒动态系统中学习安全控制策略和屏障证书，无需精确的系统模型，并证明了安全证书在黑盒系统上成立。

Jan, 2022

初始化未知模型和不可行安全证书下的安全在线动态学习

通常，学习和控制过程中利用约束安全证书的技术被用于保证安全性，但是过高的模型不确定性可能使得鲁棒安全认证方法变得不可行。本文考虑了基于控制屏障函数（CBF）二阶锥规划的具有鲁棒安全证书的学习环境，在该环境下，如果控制屏障函数证书是可行的，我们的方法将利用它来保证安全性。否则，我们的方法通过探索系统动力学来收集数据，恢复控制屏障函数约束的可行性。我们采用了一种受贝叶斯优化中成熟工具启发的方法。我们证明，如果采样频率足够高，我们可以恢复鲁棒 CBF 证书的可行性，从而保证安全性。我们的方法不需要先验模型，据我们所知，这是第一个在存在偶尔不可行安全证书的情况下无需备份非学习型控制器即可保证安全的算法。

Nov, 2023

数据驱动的分布式稳健安全验证：基于屏障证书和条件平均嵌入

通过使用屏障证书的概念，从系统的紧凑轨迹集合直接学习并构造一个可以根据一组可信转移内核对结果进行鲁棒化的重复核希尔伯特空间的模糊集合，我们展示了如何使用均值嵌入将系统数据嵌入到重复核希尔伯特空间（RKHS）中，并使用和方差优化和高斯过程包络来高效解决由此产生的问题。与最先进的方法相比，在测试案例上，我们的方法减少了在验证系统安全性方面的样本复杂度。

Mar, 2024

安全控制策略的神经证书

本文提出一种方法，通过联合学习障碍函数和类李亚普诺夫函数的神经网络来实现动态系统的安全和目标控制，该方法在摆、小车倒立杆和无人机等动态系统中得到了有效应用。

Jun, 2020

带概率安全屏障证书的不确定多机器人碰撞避免

本文提出了一种针对多机器人系统中的碰撞回避问题所设计的方法，该方法需要考虑测量和运动的不确定性，使用概率安全障碍证书 (PrSBC) 和控制障碍函数 (Control Barrier Functions) 来定义可接受的控制操作空间，并通过最小化现有控制器来确定替代安全控制器。该方法不需要对不确定性形式做任何假设，同时适用于最坏情况下的保证。最后，作者通过实验验证了该方法的有效性。

Dec, 2019

基于数据的安全证书的可伸缩合成及其在基于学习的控制中的应用

本文提出了有效的技术来综合安全集合和控制律，通过基于凸优化问题的近似来提供改进的可伸缩性质，其中一种方法仅需要近似的线性系统模型和 Lipschitz 连续的未知非线性动力学，展示了数字示例，包括一个自主车队。

Nov, 2017

具有障碍认证的自适应强化学习及其在 Brushbot 导航中的应用

本文提出了一个安全学习框架，该框架采用自适应模型学习算法以及障碍证书，用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构，并结合控制障碍证书来保持安全。在一定条件下，保证了违反安全性后的 Lypunov 稳定恢复。最终证明了该框架通过仿真和测试的方式，在具有未知、高度复杂和非平稳动态的机器人系统中是有效的。

Jan, 2018

通过神经障碍证明实现安全可达集的计算

在线安全验证自主系统的一项新技术，通过使用神经屏障证书有效地进行有界和无界时域的可达性分析，我们的方法使用由参数化神经网络给出的屏障证书，这些证书依赖于给定的初始集合，不安全集合和时间范围。

Apr, 2024