学习控制屏障函数及其在强化学习中的应用：综述

Apr, 2024

学习控制屏障函数及其在强化学习中的应用：综述

Learning Control Barrier Functions and their application in Reinforcement Learning: A Survey

Maeva Guerrier, Hassan Fouad, Giovanni Beltrame

TL;DR通过综合回顾现有文献，研究使用控制屏障函数的安全强化学习方法，并探索自动学习控制屏障函数的各种技术，以提高强化学习在实际机器人应用中的安全性和效能。

Abstract

reinforcement learning is a powerful technique for developing new robot behaviors. However, typical lack of safety guarantees constitutes a hurdle for its practical application on real robots. To address this issue, safe →

reinforcement learning safe reinforcement learning control barrier functions data-driven methods robot applications

发现论文，激发创造

使用监督式机器学习方法合成控制屏障函数

该论文描述了一种从传感器数据中估计控制屏障函数的学习框架，经实验证明可以在未知状态空间区域中实现机器人系统的安全操作。

Mar, 2020

使用控制李雅普诺夫障碍函数进行安全机器人控制的强化学习

本文研究使用控制李亚普诺夫壁函数（CLBF）来分析安全性和可达性，使用 Lyapunov 壁演员 - 评论家（LBAC）算法进行数据驱动寻找控制器，以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中，实验结果显示了该方法在可达性和安全性方面的优异表现。

May, 2023

使用概率控制障碍函数进行安全强化学习以实现匝道合并

控制屏障函数嵌入强化学习策略中，使用概率控制屏障函数作为模型不确定性的估计，实现了安全而高效的自动驾驶算法，可以应用于高速公路匝道合并问题。

Dec, 2022

基于障碍函数的端到端安全强化学习在安全关键型连续控制任务中的应用

本文提出了一种控制器架构，该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合，以确保学习过程中的安全，并利用高斯过程对系统动态进行建模和不确定性分析。

Mar, 2019

具有控制障碍函数的安全关键控制学习

利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性，从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证，这种方法可以持续收集数据并更新控制器，最终实现安全行为。

Dec, 2019

从专家演示中学习控制屏障函数

本文提出一种基于学习的方法来合成安全控制器，该方法基于控制屏障函数，考虑非线性控制仿射动力系统的情况，并假设我们可以访问由专家生成的安全轨迹，在此基础上，提出和分析了基于优化的 CBF 学习方法，其具有可证明的安全保证。

Apr, 2020

基于控制壁函数的安全反向强化学习

本文提出了一个名为 CBFIRL 的安全 IRL 框架，利用控制屏障函数（CBF）增强 IRL 策略的安全性，通过梯度下降联合优化 CBF 要求灵感的损失函数和 IRL 方法的目标，在实验中表明我们的框架相较于没有 CBF 的 IRL 方法更加安全，并展示了在 2D 赛车领域的两个难度级别和 3D 无人机领域的安全性提高了 15% 和 20% 和 50%。

Dec, 2022

控制屏障函数理论与应用

介绍控制屏障函数及其在安全关键控制器优化中的应用，概述其主要技术结果并讨论在机器人系统等多个领域的应用。

Mar, 2019

使用强健神经李亚普诺夫障函数的安全非线性控制

本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Sep, 2021

SABLAS: 黑箱动态系统安全控制学习

本文提出了一种新的方法，用于从黑盒动态系统中学习安全控制策略和屏障证书，无需精确的系统模型，并证明了安全证书在黑盒系统上成立。

Jan, 2022