多智能体系统学习策略的碰撞避免验证
该研究提出了一种基于深度强化学习的分散式多智能体碰撞避免算法,该算法利用价值网络来实现高效(即可实时实施)的查询并考虑其他智能体的运动不确定性,与现有碰撞避免策略相比显示出更高的路径质量改进。
Sep, 2016
本文考虑了使用神经网络控制器的自主机器人的安全性问题。通过构建系统的一个有限状态抽象并使用标准的可达性分析方法,计算出一组安全的初始状态,使得从这些初始状态开始的机器人轨迹能够避开多面体障碍物。
Oct, 2018
利用神经网络作为预测模型来解决具有不确定性的动力系统的轨迹跟踪问题,并通过混合整数线性规划方法提供了整体系统的安全保证。
Dec, 2023
该研究将飞机避碰系统问题定义为马尔科夫决策过程,并使用动态规划进行警告逻辑的优化,使用神经网络压缩以便在有限的硬件上运行,通过神经网络验证工具进行安全性检查的结果发现成千上万个不安全的反例。
Mar, 2019
本研究主要探讨基于模型的强化学习中的安全性和鲁棒性问题,包括使用贝叶斯神经网络描述动态模型来计算迭代预测的到达 - 避免概率,以及使用控制综合算法综合出最佳控制策略以满足安全性约束和学习到的动态模型。
Oct, 2023
该研究提出了一种基于学习控制障碍函数作为安全证书实现的多智能体安全控制方法,该方法可以在分散式网络中进行联合学习,并且可以适应任意数量的智能体。在实验中,该方法显著优于其他主要的多智能体控制方法,并具有出色的泛化能力。
Jan, 2021
本文提出了一种使用状态量化和反向可达性验证无人机收发器 ACAS Xu 系统闭环逼近的技术,以验证系统的安全性,并发现了该系统在真实情况下存在碰撞的情况。
Jan, 2022
本论文利用对称神经网络建立一种新的对抗性碰撞避免方法,通过在网络权重之间施加约束以减少模型优化搜索空间,提高车辆转向的控制精度,通过在模拟环境中进行训练和验证,分析了提出的方法并评估了其性能,结果表明该方法的学习曲线和一般化性良好。
Mar, 2022
本文介绍了 CART,一种分析方法,旨在增强一个非线性多智能体系统的基于学习的分布式动态规划策略,独立于学习误差,具有实时的避碰和强鲁棒性保证,并正式推导出安全滤波器和强鲁棒滤波器的解析形式,证明了这些结果进一步扩展到使用收缩理论的一般控制仿形非线性系统。
Jul, 2023
该研究提出了一种名为 M$\pi$Nets 的端到端神经模型,用于从单个深度摄像头观察中生成碰撞自由、平稳的运动,经过在超过 500,000 个环境中进行的超过 3 百万次运动规划实验的训练,证明 M$\pi$Nets 比以前的神经规划器快 46%,比本地控制策略更具鲁棒性,并具有应对动态场景所需的反应性。
Oct, 2022