通过综合回顾现有文献,研究使用控制屏障函数的安全强化学习方法,并探索自动学习控制屏障函数的各种技术,以提高强化学习在实际机器人应用中的安全性和效能。
Apr, 2024
本文提出了一种控制器架构,该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合,以确保学习过程中的安全,并利用高斯过程对系统动态进行建模和不确定性分析。
Mar, 2019
该论文描述了一种从传感器数据中估计控制屏障函数的学习框架,经实验证明可以在未知状态空间区域中实现机器人系统的安全操作。
Mar, 2020
本文研究使用控制李亚普诺夫壁函数(CLBF)来分析安全性和可达性,使用 Lyapunov 壁演员 - 评论家(LBAC)算法进行数据驱动寻找控制器,以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中,实验结果显示了该方法在可达性和安全性方面的优异表现。
May, 2023
本研究提出了一种基于强化学习的驾驶辅助系统,利用指数控制屏障函数过滤不安全的动作,并利用 MPO 算法计算控制动作以最大化累计奖励。研究表明,该系统可以在训练和评估过程中有效避免碰撞,并提高司机辅助系统的燃油经济性。
Jan, 2023
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020
本文介绍了一种基于感知的学习系统的安全保障框架,该系统采用可微控制屏障函数,与常规神经网络结构组合使用,可在有限训练数据下实现优异的测试性能,在自动驾驶情境下保障安全,包括实现车道保持和避障等功能,并在模拟和真实无人车上进行了测试。
Mar, 2022
本文提出了一种新的方法,用于从黑盒动态系统中学习安全控制策略和屏障证书,无需精确的系统模型,并证明了安全证书在黑盒系统上成立。
Jan, 2022
我们提出了一种安全的基于深度强化学习和控制障碍函数的负载均衡算法,能在训练和测试过程中将不安全的操作转化为可行的操作,引导学习朝着安全策略的方向,并在 GPU 上实现了该解决方案,实现了模型更新和培训的加速,同时在满足链路容量限制的安全要求下交付接近最优的服务质量性能。
Jan, 2024