学习充电：通过深度强化学习进行无人机覆盖路径规划

Sep, 2023

学习充电：通过深度强化学习进行无人机覆盖路径规划

Learning to Recharge: UAV Coverage Path Planning through Deep Reinforcement Learning

Mirco Theile, Harald Bayerlein, Marco Caccamo, Alberto L. Sangiovanni-Vincentelli

TL;DR通过利用基于地图的观测、动作掩码和折扣因子调度的近端策略优化（PPO）深度强化学习（DRL）方法，尤其考虑充电航程的整体覆盖策略中复杂长期决策的问题，本研究提出了一种解决无人机有限电池的电量限制覆盖路径规划（CPP）问题的新方法，提供了处理由充电能力引起的紧急状态循环的位置历史，超越了基线启发式算法，并对长期问题的 DRL 算法设计提供了有价值的见解，并为 CPP 问题提供了一个可公开使用的软件框架。

Abstract

coverage path planning (CPP) is a critical problem in robotics, where the goal is to find an efficient path that covers every point in an area of interest. This work addresses the power-constrained cpp problem wi

coverage path planning power-constrained cpp recharge journeys proximal policy optimization deep reinforcement learning

发现论文，激发创造

利用深度强化学习进行变化功率限制下的无人机覆盖路径规划

本文提出了一种新方法，利用端到端强化学习通过地图通道提供空间信息并使用 DDQN 平衡有限电力预算和无人机的航程，以控制在一些禁飞区域有随机起飞位置和多个降落选项的环境中的无人机 CNN 航迹规划任务，此方法可以应用于各种环境且很好地协调了复杂的系统约束与目标结构。

Mar, 2020

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

无线电联网无人机的联合路径规划和功率分配，利用通过深度反向强化学习的学徒学习

该研究论文探讨了一种面向空中无人机的干扰感知联合路径规划和功率分配机制，旨在最大化上行吞吐量并降低地面用户设备的干扰，模拟结果表明该方法可以实现专家级别的性能水平。

Jun, 2023

未知环境下在线覆盖路径规划的端到端强化学习

该研究提出了基于强化学习的、连续状态和动作空间下的在线覆盖路径规划方法，用于处理未知环境的大型区域，并且结合了全局地图和局部感知输入，以及多尺度地图输入表示的观测空间构建，通过提出的全变差奖励，实现了学习路径上无漏洞被覆盖的目标。

Jun, 2023

使用强化学习设计蜂窝网络连接的无人机路径

本文研究了无人机的路径设计问题，提出了一种新的基于强化学习的算法，通过学习相应的 MDP 的状态 - 价值函数来求解，并使用瓦片编码对大状态空间进行处理。该算法使用原始测量或仿真生成的信号强度作为输入，可适用于在线和离线实现，并成功地避免了城市环境中蜂窝网络的覆盖漏洞。

May, 2019

自主飞行器基于深度强化学习的长期规划

本文研究了基于现实生活中无人机赛事的长期规划场景，对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验，使用对手无人机的 GPS 信息作为专家指导进行训练，成功解决了复杂状态空间问题，其代码可以在我们的 GitHub 存储库中找到。

Jul, 2020

SREC: 基于深度强化学习的能量受限无人机网络的主动自我修复

该研究探讨了当无人机网络中一架或多架无人机能量不足准备告别网络充电时，应该如何采取措施来提高用户满意度。研究使用深度强化学习来实现无人机的自我维护，并在数值实验中取得了积极的成果。

Sep, 2020

基于强化学习的清洁机器人路径规划

采用强化学习和迁移学习优化的有效路径规划方法，可在不同环境下使用以增加清洁机器人的训练性能和收敛速度，显著提高其清洁效率和性能。

Aug, 2022

ARDDQN：无人机覆盖路径规划和数据采集的注意力循环双重深度 Q 网络

提出了一种 ARDDQN（基于注意力的循环双重深度 Q 网络），综合了双重深度 Q 网络（DDQN）、循环神经网络（RNN）和注意力机制，以实现最大限度地收集来自物联网设备的数据和学习无人机的控制方案，同时结合了无人机定位、数据收集和路径覆盖比率。

May, 2024

基于深度强化学习的无人机三维轨迹与数据采集优化

本文旨在通过设计并运用基于最短路径的无人机来提升物联网设备数据的收集和资源分配。同时，设计了一个基于深度强化学习的技术来获取特定区域内的最优轨迹和吞吐量，从而实现了无人机自主收集所有数据的目标，而且显著提高了总速率，最小化了关联资源的使用。实验结果证实了方案在效率、轨迹、时间等方面的优势。

Jun, 2021