基于深度强化学习的分散式非通信多智能体避碰

Sep, 2016

基于深度强化学习的分散式非通信多智能体避碰

Decentralized Non-communicating Multiagent Collision Avoidance with Deep Reinforcement Learning

Yu Fan Chen, Miao Liu, Michael Everett, Jonathan P. How

TL;DR该研究提出了一种基于深度强化学习的分散式多智能体碰撞避免算法，该算法利用价值网络来实现高效（即可实时实施）的查询并考虑其他智能体的运动不确定性，与现有碰撞避免策略相比显示出更高的路径质量改进。

Abstract

Finding feasible, collision-free paths for multiagent systems can be challenging, particularly in non-communicating scenarios where each agent's intent (e.g. goal) is unobservable to the others. In particular, finding time efficient paths often requires anticipating interaction with ne

multiagent systems collision avoidance deep reinforcement learning value network real-time implementable

发现论文，激发创造

深度强化学习中动态决策机构的运动规划

本文介绍了一种基于深度强化学习和 LSTM 的算法，可以在不使用特定行为规则的情况下，学习各种类型的动态代理之间的避碰。通过仿真和在全自主机器人车辆上的实验，证明了该算法随着代理数量的增加能够更好地执行避碰，并且不需要使用 3D 激光雷达。

May, 2018

多智能体强化学习下的动态避障无人机路径规划

我们提出了一种基于多智能体强化学习的新颖集中训练与分散执行方法，用于在线解决动态避障问题。改进方法采用模型预测控制的思想提高智能体的训练效率和样本利用率，并通过模拟、室内和室外环境的实验结果验证了方法的有效性。

Oct, 2023

基于深度强化学习的避障轨迹规划与鲁棒低层控制方法在机器人操纵器中的应用

在机器人学中，我们提出了一种集成无障碍深度强化学习轨迹规划器和新颖的自适应低级和关节级控制策略的方法，通过与环境的交互来激活学习阶段，解决了学习基于模型的复杂性和稳定性和安全性之间的挑战。

Feb, 2024

移动机器人避障的安全实践强化学习

本文提出了一种结合现实强化学习、基于搜索的在线轨迹规划和自动紧急情况干预的高效碰撞避免系统，用于在室内实际环境下的移动机器人安全行驶。实验结果显示该方法比多种基线更优秀，可以实现更高的平均速度、更低的碰撞频率、更高的目标达成率、更小的计算开销和更平滑的整体控制。

Sep, 2022

基于深度强化学习的碰撞动量用于对抗行人建模

本文提出了一种基于强化学习算法的行人模拟方法，专门针对边缘案例下自动驾驶控制器的不足，并且能够产生更严重的碰撞，以便在复杂多变的情况下识别并纠正自动驾驶算法的缺陷。

Jun, 2023

多智能体系统学习策略的碰撞避免验证

通过后向可达性方法验证多智能体神经反馈循环（MA-NFL）的碰撞避免属性，并展示该方法在 10 个智能体系统上的计算可扩展性。

Mar, 2024

通过深度强化学习实现平滑轨迹避碰

本论文针对 DRL 导航解决方案中的两个核心问题提出了多种新的代理状态和奖励函数设计，即平滑性训练轨迹和模型泛化能力，利用边缘奖励和平滑度约束来确保无人机平稳飞行，同时大大降低碰撞风险，并演示整个设计和各组件的有效性。

Oct, 2022

碰撞避免的不确定性感知强化学习

本研究提出了一种基于不确定性的模型学习算法，以实现移动机器人学习导航和避免碰撞的目标，该算法可以估计碰撞概率并通过不确定度来控制行进速度，并利用神经网络从传感器中处理原始数据，实验结果表明，该方法能在模拟和真实的四旋翼和遥控汽车中有效地减少训练期间的危险碰撞。

Feb, 2017

对抗多智能体游戏中的扩散 - 强化学习层次化运动规划

基于强化学习的运动规划在自主导航到机器人操控等方面已显示出超越传统方法的潜力。本文针对部分可观察多智能体对抗潜逃游戏（PEG）中规划机动任务展开研究。我们提出了一种分层架构，将高层扩散模型与低层强化学习算法结合，分别用于全局路径规划和回避行为推理。该方法通过利用扩散模型引导强化学习算法进行更高效的探索，并提高了可解释性和预测能力，相较于基准模型的表现提高了 51.2%。

Mar, 2024

通过双层优化的去中心化非合作机器人社交导航

本文提出了一种全面去中心化的方法，用于社交小游戏中的实时非合作多机器人导航，使用新的实时双层优化算法来规划基于优先顺序的最优轨迹，并证明了该算法的有效性。

Jun, 2023