学习控制屏障函数及其在强化学习中的应用:综述
本文研究使用控制李亚普诺夫壁函数(CLBF)来分析安全性和可达性,使用 Lyapunov 壁演员 - 评论家(LBAC)算法进行数据驱动寻找控制器,以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中,实验结果显示了该方法在可达性和安全性方面的优异表现。
May, 2023
控制屏障函数嵌入强化学习策略中,使用概率控制屏障函数作为模型不确定性的估计,实现了安全而高效的自动驾驶算法,可以应用于高速公路匝道合并问题。
Dec, 2022
本文提出了一种控制器架构,该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合,以确保学习过程中的安全,并利用高斯过程对系统动态进行建模和不确定性分析。
Mar, 2019
利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性,从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证,这种方法可以持续收集数据并更新控制器,最终实现安全行为。
Dec, 2019
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020
本文提出了一个名为 CBFIRL 的安全 IRL 框架,利用控制屏障函数(CBF)增强 IRL 策略的安全性,通过梯度下降联合优化 CBF 要求灵感的损失函数和 IRL 方法的目标,在实验中表明我们的框架相较于没有 CBF 的 IRL 方法更加安全,并展示了在 2D 赛车领域的两个难度级别和 3D 无人机领域的安全性提高了 15% 和 20% 和 50%。
Dec, 2022
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021