多智能体系统学习策略的碰撞避免验证

Mar, 2024

多智能体系统学习策略的碰撞避免验证

Collision Avoidance Verification of Multiagent Systems with Learned Policies

Zihao Dong, Shayegan Omidshafiei, Michael Everett

TL;DR通过后向可达性方法验证多智能体神经反馈循环（MA-NFL）的碰撞避免属性，并展示该方法在 10 个智能体系统上的计算可扩展性。

Abstract

For many multiagent control problems, neural networks (NNs) have enabled promising new capabilities. However, many of these systems lack formal guarantees (e.g., →

multiagent control problems neural networks formal guarantees collision avoidance backward reachability-based approach

发现论文，激发创造

基于深度强化学习的分散式非通信多智能体避碰

该研究提出了一种基于深度强化学习的分散式多智能体碰撞避免算法，该算法利用价值网络来实现高效（即可实时实施）的查询并考虑其他智能体的运动不确定性，与现有碰撞避免策略相比显示出更高的路径质量改进。

Sep, 2016

神经网络控制自主系统的形式化验证

本文考虑了使用神经网络控制器的自主机器人的安全性问题。通过构建系统的一个有限状态抽象并使用标准的可达性分析方法，计算出一组安全的初始状态，使得从这些初始状态开始的机器人轨迹能够避开多面体障碍物。

Oct, 2018

系统级安全防护：通过不确定的神经网络动力学模型实现安全跟踪控制

利用神经网络作为预测模型来解决具有不确定性的动力系统的轨迹跟踪问题，并通过混合整数线性规划方法提供了整体系统的安全保证。

Dec, 2023

通过安全区域的线性逼近验证飞机防撞神经网络

该研究将飞机避碰系统问题定义为马尔科夫决策过程，并使用动态规划进行警告逻辑的优化，使用神经网络压缩以便在有限的硬件上运行，通过神经网络验证工具进行安全性检查的结果发现成千上万个不安全的反例。

Mar, 2019

贝叶斯神经网络的概率式到达 - 避免

本研究主要探讨基于模型的强化学习中的安全性和鲁棒性问题，包括使用贝叶斯神经网络描述动态模型来计算迭代预测的到达 - 避免概率，以及使用控制综合算法综合出最佳控制策略以满足安全性约束和学习到的动态模型。

Oct, 2023

分散式神經屏障證明的安全多智能體控制學習

该研究提出了一种基于学习控制障碍函数作为安全证书实现的多智能体安全控制方法，该方法可以在分散式网络中进行联合学习，并且可以适应任意数量的智能体。在实验中，该方法显著优于其他主要的多智能体控制方法，并具有出色的泛化能力。

Jan, 2021

ACAS Xu 早期原型的神经网络压缩存在安全隐患：通过量化状态反向可达性进行闭环验证

本文提出了一种使用状态量化和反向可达性验证无人机收发器 ACAS Xu 系统闭环逼近的技术，以验证系统的安全性，并发现了该系统在真实情况下存在碰撞的情况。

Jan, 2022

使用对称性进化神经网络的无碰撞导航

本论文利用对称神经网络建立一种新的对抗性碰撞避免方法，通过在网络权重之间施加约束以减少模型优化搜索空间，提高车辆转向的控制精度，通过在模拟环境中进行训练和验证，分析了提出的方法并评估了其性能，结果表明该方法的学习曲线和一般化性良好。

Mar, 2022

基于学习的多智能体系统运动规划中的 CART: 碰撞避免和鲁棒跟踪增强

本文介绍了 CART，一种分析方法，旨在增强一个非线性多智能体系统的基于学习的分布式动态规划策略，独立于学习误差，具有实时的避碰和强鲁棒性保证，并正式推导出安全滤波器和强鲁棒滤波器的解析形式，证明了这些结果进一步扩展到使用收缩理论的一般控制仿形非线性系统。

Jul, 2023

运动策略网络

该研究提出了一种名为 M$\pi$Nets 的端到端神经模型，用于从单个深度摄像头观察中生成碰撞自由、平稳的运动，经过在超过 500,000 个环境中进行的超过 3 百万次运动规划实验的训练，证明 M$\pi$Nets 比以前的神经规划器快 46％，比本地控制策略更具鲁棒性，并具有应对动态场景所需的反应性。

Oct, 2022