安全控制策略的神经证书
本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法,以学习非线性闭环动力系统的准确安全证明,并在模拟倒立摆中演示了该方法的应用,讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。
Aug, 2018
该研究提出了一种基于学习控制障碍函数作为安全证书实现的多智能体安全控制方法,该方法可以在分散式网络中进行联合学习,并且可以适应任意数量的智能体。在实验中,该方法显著优于其他主要的多智能体控制方法,并具有出色的泛化能力。
Jan, 2021
本文提出了有效的技术来综合安全集合和控制律,通过基于凸优化问题的近似来提供改进的可伸缩性质,其中一种方法仅需要近似的线性系统模型和 Lipschitz 连续的未知非线性动力学,展示了数字示例,包括一个自主车队。
Nov, 2017
在线安全验证自主系统的一项新技术,通过使用神经屏障证书有效地进行有界和无界时域的可达性分析,我们的方法使用由参数化神经网络给出的屏障证书,这些证书依赖于给定的初始集合,不安全集合和时间范围。
Apr, 2024
本论文介绍了一种利用神经网络提供形式化到达 - 避免保证的方法,通过在随机非线性动态系统中学习控制器来解决实现证明的问题,以及提出了超级马丁格尔的概念作为证明,并通过对 Lyapunov 函数的确定性系统的随机扩展上的级集的约束来提供可达性和避开保证。
Oct, 2022
论文介绍了一种新颖的方法,用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式,确保 Lyapunov 证书的单调减少,解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中,证明了在包括超出分布范围的模型不确定性的情况下,闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中,将该方法与无关不确定性的基准方法和几个强化学习方法进行比较,验证了所提出方法的有效性和高效性。
Apr, 2024
该论文提出了一种考虑安全性的学习算法,利用 Lyapunov 稳定性检验的控制理论结果和动力学统计模型,得到具备可证明稳定性证书的高性能控制策略,并通过高斯过程先验进一步保证数据安全性和提高控制性能。在反演摆模拟实验中表现出安全性高、控制性能良好的特点。
May, 2017
该论文提出基于高斯过程的数据驱动方法,学习部分未知环境下四旋翼的模型,采用屏障证明方法确保学习过程的安全,并设计了学习控制器以及递归高斯过程预测方法,模拟结果表明该方法的有效性。
Oct, 2017
本文提出一种基于模型学习的方法,根据鲁棒凸优化和 Lyapunov 理论定义了鲁棒控制 Lyapunov 阻碍函数,以实现具有安全性和稳定性保证的控制器,并在诸如汽车轨迹跟踪、带障碍物避障的非线性控制、带安全性约束的卫星交会和具有学习地效果模型的飞行控制等问题上展示了其模拟结果,表明我们的方法降低了计算成本,并且得到的控制器的能力与稳健 MPC 技术相匹配或优于其能力。
Sep, 2021