使用障碍证明实现四旋翼动力学的安全学习
通过使用障碍证明方法,结合高斯过程回归,本文介绍了一种从具备未知动力学的随机系统数据中鉴定出一组最大安全策略的方法。通过学习系统动力学并得到该预估的概率误差,我们开发了一种算法来构建分段随机障碍函数,从而利用学习到的高斯过程模型找到一组最大允许的策略集,该集合通过有序地剔除最糟糕的控制策略直至得到最大集合,保证了真实系统的概率安全性。这对于学习能力系统而言尤为重要,因为丰富的策略空间不仅可以增加数据采集,还能保持安全性并展现复杂行为。线性和非线性系统的案例研究表明,扩大用于学习系统的数据集大小能够增加最大允许的策略集。
Apr, 2024
本文提出了一个安全学习框架,该框架采用自适应模型学习算法以及障碍证书,用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构,并结合控制障碍证书来保持安全。在一定条件下,保证了违反安全性后的 Lypunov 稳定恢复。最终证明了该框架通过仿真和测试的方式,在具有未知、高度复杂和非平稳动态的机器人系统中是有效的。
Jan, 2018
通常,学习和控制过程中利用约束安全证书的技术被用于保证安全性,但是过高的模型不确定性可能使得鲁棒安全认证方法变得不可行。本文考虑了基于控制屏障函数(CBF)二阶锥规划的具有鲁棒安全证书的学习环境,在该环境下,如果控制屏障函数证书是可行的,我们的方法将利用它来保证安全性。否则,我们的方法通过探索系统动力学来收集数据,恢复控制屏障函数约束的可行性。我们采用了一种受贝叶斯优化中成熟工具启发的方法。我们证明,如果采样频率足够高,我们可以恢复鲁棒 CBF 证书的可行性,从而保证安全性。我们的方法不需要先验模型,据我们所知,这是第一个在存在偶尔不可行安全证书的情况下无需备份非学习型控制器即可保证安全的算法。
Nov, 2023
通过将源系统的控制障碍证书与目标系统的逆动力学神经网络进行整合,我们提出了一种验证控制器正确性的新方法,并通过三个案例研究证明了其有效性。
May, 2024
本文提出了有效的技术来综合安全集合和控制律,通过基于凸优化问题的近似来提供改进的可伸缩性质,其中一种方法仅需要近似的线性系统模型和 Lipschitz 连续的未知非线性动力学,展示了数字示例,包括一个自主车队。
Nov, 2017
本文介绍一种为解决调参过程可能导致的安全失败问题而开发的安全优化算法 ——SafeOpt,该算法通过将性能度量建模为高斯过程并探索高于安全性能阈值的新控制器参数来自动优化控制器参数,以实现快速、自动和安全的控制器参数优化,实验数据表明该方法可以在不需要人工干预的情况下快速、自动、安全地优化控制器参数。
Sep, 2015
本文提出了一种适应不确定参数系统的自适应在线学习框架,以确保非平稳环境下的安全临界控制;该方法包括两个阶段,第一阶段基于稀疏高斯过程算法改进,第二阶段提出了基于高阶控制屏障函数的安全过滤器与学习模型相结合,并通过实时障碍物避免实验证明了算法的有效性。
Feb, 2024
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021