基于端到端强化学习的四旋翼群体的避障和导航

Sep, 2023

基于端到端强化学习的四旋翼群体的避障和导航

Collision Avoidance and Navigation for a Quadrotor Swarm Using End-to-end Deep Reinforcement Learning

Zhehui Huang, Zhaojing Yang, Rahul Krupani, Baskın Şenbaşlar, Sumeet Batra...

TL;DR在包含障碍物的环境中，我们提出一种使用端到端深度强化学习（DRL）控制无人机群的方法，该方法通过提供课程和剪辑碰撞情景的重放缓冲区来改善性能，并且实现了对邻居机器人和障碍物交互的注意机制。这是首次成功地将该机制应用于在计算资源受限的硬件上部署的群体行为策略，我们的方法可以在模拟环境中实现 32 架机器人并达到 80％的障碍物密度，在实际物理环境中可以实现 8 架机器人并达到 20％的障碍物密度，并且可以零 - shot 地转移到真实的无人机上。

Abstract

end-to-end deep reinforcement learning (DRL) for quadrotor control promises many benefits -- easy deployment, task generalization and real-time execution capability. Prior end-to-end DRL-based methods have showca

end-to-end deep reinforcement learning quadrotor control obstacle-rich environments swarm behavior obstacle-avoiding control policies

发现论文，激发创造

基于深度强化学习的避障轨迹规划与鲁棒低层控制方法在机器人操纵器中的应用

在机器人学中，我们提出了一种集成无障碍深度强化学习轨迹规划器和新颖的自适应低级和关节级控制策略的方法，通过与环境的交互来激活学习阶段，解决了学习基于模型的复杂性和稳定性和安全性之间的挑战。

Feb, 2024

通过深度强化学习实现平滑轨迹避碰

本论文针对 DRL 导航解决方案中的两个核心问题提出了多种新的代理状态和奖励函数设计，即平滑性训练轨迹和模型泛化能力，利用边缘奖励和平滑度约束来确保无人机平稳飞行，同时大大降低碰撞风险，并演示整个设计和各组件的有效性。

Oct, 2022

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

多智能体强化学习下的动态避障无人机路径规划

我们提出了一种基于多智能体强化学习的新颖集中训练与分散执行方法，用于在线解决动态避障问题。改进方法采用模型预测控制的思想提高智能体的训练效率和样本利用率，并通过模拟、室内和室外环境的实验结果验证了方法的有效性。

Oct, 2023

面向无人机有限环境知识的基于记忆的深度强化学习障碍物避难技术

本文提出了基于深度强化学习和递归神经网络的无人机避障技术，可在未知室内环境中自主避免障碍物，提高了导航距离和推理速率。

Nov, 2018

使用深度强化学习的机器人路径规划

本文介绍了如何使用强化学习方法和深度 Q 网络等算法，使得机器人可以在未知环境中进行自主导航的任务。我们还利用模拟环境对机器人代理的行为和性能进行了验证和分析。

Feb, 2023

基于深度 Q 学习的自主仓库机器人

提出采用深度强化学习和传统的 Q-learning 方法来解决仓库机器人导航，避障和产品摆放等问题，包括针对单机器人，多机器人的情况，成功在二维仿真环境中测试了模型的性能。

Feb, 2022

分散化强化学习多机器人编队控制

基于强化学习算法的分布式多机器人编队控制，并采用 DDQN 算法，通过离散机器人运动来适应连续非线性系统，无需复杂数学模型和非线性控制器即可在模拟和实验中实现稳定编队。

Jun, 2023

基于演化课程训练的 DRL 导航系统训练

本文介绍了一种名为进化课程训练的新方法，以应对机器人避碰中经常出现的一些挑战，包括在结构化环境中适应多种行人，本方法能够提高深度强化学习模型在此类复杂场景中的成功率和降低平均碰撞率。

Jun, 2023

基于单目视觉的深度强化学习障碍物避免

提出了基于 D3QN 的深度学习网络，利用单目 RGB 视觉输入解决在虚拟和实际环境中的机器人避障问题。

Jun, 2017