通过综合回顾现有文献,研究使用控制屏障函数的安全强化学习方法,并探索自动学习控制屏障函数的各种技术,以提高强化学习在实际机器人应用中的安全性和效能。
Apr, 2024
利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性,从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证,这种方法可以持续收集数据并更新控制器,最终实现安全行为。
Dec, 2019
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021
本文在实时基于优化的控制器的背景下,发展了一种方法论,将以控制层李雅普诺夫函数表达的性能目标与以控制屏障函数表示的安全条件相结合,并在二次规划的框架下演示了自适应巡航控制和车道保持这两个汽车控制问题的安全和性能的调节。
Sep, 2016
介绍控制屏障函数及其在安全关键控制器优化中的应用,概述其主要技术结果并讨论在机器人系统等多个领域的应用。
Mar, 2019
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020
控制屏障函数嵌入强化学习策略中,使用概率控制屏障函数作为模型不确定性的估计,实现了安全而高效的自动驾驶算法,可以应用于高速公路匝道合并问题。
Dec, 2022
本文提出一种基于学习的方法,通过构建基于神经网络的 Control Barrier Functions (CBFs) 来确保广泛类别的非线性混合动力系统的安全,从而解决现有方法的计算效率低、对系统性能不利或仅适用于小规模系统的问题。
Jan, 2024
本文研究使用控制李亚普诺夫壁函数(CLBF)来分析安全性和可达性,使用 Lyapunov 壁演员 - 评论家(LBAC)算法进行数据驱动寻找控制器,以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中,实验结果显示了该方法在可达性和安全性方面的优异表现。
May, 2023
本研究提出了一种新颖的自监督学习框架,通过建立一个连续可微函数和平滑神经网络来参数化 Control Barrier Functions (CBF) 的候选项,然后设计一个基于 Hamilton-Jacobi 偏微分方程的训练损失函数来训练 CBF,从而同时增大感应控制不变集的体积,并通过数值实验证明了我们方法的有效性。