控制屏障函数理论与应用
利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性,从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证,这种方法可以持续收集数据并更新控制器,最终实现安全行为。
Dec, 2019
本文在实时基于优化的控制器的背景下,发展了一种方法论,将以控制层李雅普诺夫函数表达的性能目标与以控制屏障函数表示的安全条件相结合,并在二次规划的框架下演示了自适应巡航控制和车道保持这两个汽车控制问题的安全和性能的调节。
Sep, 2016
通过综合回顾现有文献,研究使用控制屏障函数的安全强化学习方法,并探索自动学习控制屏障函数的各种技术,以提高强化学习在实际机器人应用中的安全性和效能。
Apr, 2024
研究 stochastic dynamical system 在 finite-time horizon 下的安全性问题,提出基于 stochastic control barrier functions 的 barrier certificate condition 以量化系统在有限时间内退出给定的安全区域的概率,并将该条件表述为 sum-of-squares 优化问题进行高效的数值计算,在保证 expected value 的发展的状态相关的上限的前提下,提供了连续时间和离散时间系统的解决方案,针对控制的仿射动力学系统,提出了合成多项式状态反馈控制器以实现指定的安全概率,使用实例研究连续时间和离散时间领域中验证和控制方法的性能。
Sep, 2019
本篇研究提出了将控制理论中的验证方法应用于学习价值函数中的 RL 问题,由此得出关于安全维护的价值函数与控制障碍函数之间联系的原始定理,并提出用于安全控制任务验证价值函数的新指标和实用的实现细节。此外,该研究作品还利用控制理论中的验证方法实现了证书学习,为 RL 策略设计提供了一种全新的思路。
Jun, 2023
本文提出一种基于学习的方法,通过构建基于神经网络的 Control Barrier Functions (CBFs) 来确保广泛类别的非线性混合动力系统的安全,从而解决现有方法的计算效率低、对系统性能不利或仅适用于小规模系统的问题。
Jan, 2024
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021
本文提出了一种新颖的基于神经网络的自适应多步控制屏障函数方法,以解决当前控制屏障函数的优化、稳定性和可行性等方面的局限性,在各种场景下对一阶和二阶系统进行了评估,并定量定性地表明相对于传统控制屏障函数方法,该方法有着更出色的表现。
May, 2023
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020