多智能体系统的自适应安全学习
本文提出了一种控制器架构,该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合,以确保学习过程中的安全,并利用高斯过程对系统动态进行建模和不确定性分析。
Mar, 2019
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020
本文提出了一种新颖的基于神经网络的自适应多步控制屏障函数方法,以解决当前控制屏障函数的优化、稳定性和可行性等方面的局限性,在各种场景下对一阶和二阶系统进行了评估,并定量定性地表明相对于传统控制屏障函数方法,该方法有着更出色的表现。
May, 2023
本研究提出了一种新颖的自监督学习框架,通过建立一个连续可微函数和平滑神经网络来参数化 Control Barrier Functions (CBF) 的候选项,然后设计一个基于 Hamilton-Jacobi 偏微分方程的训练损失函数来训练 CBF,从而同时增大感应控制不变集的体积,并通过数值实验证明了我们方法的有效性。
Jan, 2024
本研究提出了一种适应性控制障碍函数(aCBFs)方法,在不确定参数的情况下使系统状态保持在安全集之内,并将适应性控制李亚普诺夫函数(aCLFs)和 aCBFs 统一为单一控制方法。此方法在基于二次规划(QP)的框架下实现系统的稳定和安全性,并在自适应巡航控制(ACC)模拟中验证了其性能。
Oct, 2019
本文提出一种基于学习的方法,通过构建基于神经网络的 Control Barrier Functions (CBFs) 来确保广泛类别的非线性混合动力系统的安全,从而解决现有方法的计算效率低、对系统性能不利或仅适用于小规模系统的问题。
Jan, 2024
本文提出了一种新颖的自适应安全控制框架,该框架采用元学习、贝叶斯模型和控制障碍函数(CBF)方法,在多重不确定性条件下保证控制过程中的概率安全性。
Jul, 2023
本文提出了一个基于控制栅函数 (control barrier function, CBF) 和控制李雅普诺夫函数 (control Lyapunov function, CLF) 方法的强化学习 (reinforcement learning, RL) 框架,称之为 Barrier-Lyapunov Actor-Critic (BLAC) 框架,它有助于维护系统的安全性和稳定性。本框架通过基于重放缓冲器中采样的数据构建安全性的控制障碍函数约束和稳定性的控制李雅普诺夫函数约束,并使用增广拉格朗日方法来更新基于 RL 的控制器的参数。此外,本文还引入了一种备份控制器,以防安全和稳定性约束无法同时满足时 RL 控制器不能提供有效的控制信号。仿真结果证明,相对于基线算法,该框架产生的控制器可以帮助系统接近期望状态,并导致更少的安全约束违反。
Apr, 2023
通过使用基于控制障碍函数的强化学习(RL)的递进式规划控制(RHC)方法,我们提出了一种用于解决安全关键问题的最优控制方法,以模型预测控制(MPC)和控制障碍函数(CBFs)为基础,通过优化参数和学习控制输入,有效提高了性能并显著减少了不可行案例的数量。
Mar, 2024
本文提出了一个名为 CBFIRL 的安全 IRL 框架,利用控制屏障函数(CBF)增强 IRL 策略的安全性,通过梯度下降联合优化 CBF 要求灵感的损失函数和 IRL 方法的目标,在实验中表明我们的框架相较于没有 CBF 的 IRL 方法更加安全,并展示了在 2D 赛车领域的两个难度级别和 3D 无人机领域的安全性提高了 15% 和 20% 和 50%。
Dec, 2022