使用概率控制障碍函数进行安全强化学习以实现匝道合并

ICMLDec, 2022

使用概率控制障碍函数进行安全强化学习以实现匝道合并

Safe Reinforcement Learning with Probabilistic Control Barrier Functions for Ramp Merging

Soumith Udatha, Yiwei Lyu, John Dolan

TL;DR控制屏障函数嵌入强化学习策略中，使用概率控制屏障函数作为模型不确定性的估计，实现了安全而高效的自动驾驶算法，可以应用于高速公路匝道合并问题。

Abstract

Prior work has looked at applying reinforcement learning and imitation learning approaches to autonomous driving scenarios, but either the safety or the efficiency of the algorithm is compromised. With the use of

reinforcement learning imitation learning safe policies control barrier functions autonomous driving

发现论文，激发创造

学习控制屏障函数及其在强化学习中的应用：综述

通过综合回顾现有文献，研究使用控制屏障函数的安全强化学习方法，并探索自动学习控制屏障函数的各种技术，以提高强化学习在实际机器人应用中的安全性和效能。

Apr, 2024

基于障碍函数的端到端安全强化学习在安全关键型连续控制任务中的应用

本文提出了一种控制器架构，该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合，以确保学习过程中的安全，并利用高斯过程对系统动态进行建模和不确定性分析。

Mar, 2019

使用监督式机器学习方法合成控制屏障函数

该论文描述了一种从传感器数据中估计控制屏障函数的学习框架，经实验证明可以在未知状态空间区域中实现机器人系统的安全操作。

Mar, 2020

使用控制李雅普诺夫障碍函数进行安全机器人控制的强化学习

本文研究使用控制李亚普诺夫壁函数（CLBF）来分析安全性和可达性，使用 Lyapunov 壁演员 - 评论家（LBAC）算法进行数据驱动寻找控制器，以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中，实验结果显示了该方法在可达性和安全性方面的优异表现。

May, 2023

一种安全的强化学习能源高效驾驶辅助系统

本研究提出了一种基于强化学习的驾驶辅助系统，利用指数控制屏障函数过滤不安全的动作，并利用 MPO 算法计算控制动作以最大化累计奖励。研究表明，该系统可以在训练和评估过程中有效避免碰撞，并提高司机辅助系统的燃油经济性。

Jan, 2023

使用强健神经李亚普诺夫障函数的安全非线性控制

本文提出一种基于模型学习的方法，根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数，以实现具有安全性和稳定性保证的控制器，并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果，表明我们的方法降低了计算成本，并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。

Sep, 2021

从专家演示中学习控制屏障函数

本文提出一种基于学习的方法来合成安全控制器，该方法基于控制屏障函数，考虑非线性控制仿射动力系统的情况，并假设我们可以访问由专家生成的安全轨迹，在此基础上，提出和分析了基于优化的 CBF 学习方法，其具有可证明的安全保证。

Apr, 2020

基于视觉端到端自动驾驶的可微控制屏障函数

本文介绍了一种基于感知的学习系统的安全保障框架，该系统采用可微控制屏障函数，与常规神经网络结构组合使用，可在有限训练数据下实现优异的测试性能，在自动驾驶情境下保障安全，包括实现车道保持和避障等功能，并在模拟和真实无人车上进行了测试。

Mar, 2022

SABLAS: 黑箱动态系统安全控制学习

本文提出了一种新的方法，用于从黑盒动态系统中学习安全控制策略和屏障证书，无需精确的系统模型，并证明了安全证书在黑盒系统上成立。

Jan, 2022

基于控制屏障函数和深度强化学习的安全负载均衡

我们提出了一种安全的基于深度强化学习和控制障碍函数的负载均衡算法，能在训练和测试过程中将不安全的操作转化为可行的操作，引导学习朝着安全策略的方向，并在 GPU 上实现了该解决方案，实现了模型更新和培训的加速，同时在满足链路容量限制的安全要求下交付接近最优的服务质量性能。

Jan, 2024