Sep, 2023

基于端到端强化学习的四旋翼群体的避障和导航

TL;DR在包含障碍物的环境中,我们提出一种使用端到端深度强化学习(DRL)控制无人机群的方法,该方法通过提供课程和剪辑碰撞情景的重放缓冲区来改善性能,并且实现了对邻居机器人和障碍物交互的注意机制。这是首次成功地将该机制应用于在计算资源受限的硬件上部署的群体行为策略,我们的方法可以在模拟环境中实现 32 架机器人并达到 80%的障碍物密度,在实际物理环境中可以实现 8 架机器人并达到 20%的障碍物密度,并且可以零 - shot 地转移到真实的无人机上。