基于协作强化学习的无人机（UAV）三维轨迹设计及跟踪

Jan, 2024

基于协作强化学习的无人机（UAV）三维轨迹设计及跟踪

Collaborative Reinforcement Learning Based Unmanned Aerial Vehicle (UAV) Trajectory Design for 3D UAV Tracking

Yujiao Zhu, Mingzhe Chen, Sihua Wang, Ye Hu, Yuchen Liu...

TL;DR本文研究使用一个主动无人机和四个被动无人机实时定位一个三维目标无人机的问题，并提出了基于 Z 函数分解的强化学习方法，通过优化无人机的轨迹和主动无人机的发送功率，以最大化目标无人机的定位精度。仿真结果表明，所提出的 ZD-RL 方法相对于 VD-RL 和独立深度 RL 方法，可以减小定位误差多达 39.4% 和 64.6%。

Abstract

In this paper, the problem of using one active unmanned aerial vehicle (UAV) and four passive UAVs to localize a 3d target UAV in real time is investigated. In the considered model, each passive UAV receives refl

unmanned aerial vehicle localization 3d target trajectory optimization z function decomposition

发现论文，激发创造

基于深度强化学习的无人机三维轨迹与数据采集优化

本文旨在通过设计并运用基于最短路径的无人机来提升物联网设备数据的收集和资源分配。同时，设计了一个基于深度强化学习的技术来获取特定区域内的最优轨迹和吞吐量，从而实现了无人机自主收集所有数据的目标，而且显著提高了总速率，最小化了关联资源的使用。实验结果证实了方案在效率、轨迹、时间等方面的优势。

Jun, 2021

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

多无人机辅助无线网络的轨迹设计与功率控制：一种机器学习方法

本研究提出了一种基于用户移动信息预测的多无人机轨迹设计的新框架，其利用机器学习技术为多个无人机实现位置信息获取和轨迹设计，并通过多智能体 Q 学习算法实现对其位置的预测与优化。同时，数值结果表明所提出的多智能体 Q 学习算法的轨迹设计和功率控制算法可以在较小的条件下收敛，并且可以实现 17％左右的吞吐量改进。

Dec, 2018

无人机敏捷主动目标感知的强化学习

本文提出了一种基于深度强化学习的方法，用于规划信息轨迹以增加无人机 (UAV) 发现丢失目标的可能性，以此来解决搜索和救援任务中的活动目标探测问题。

Dec, 2022

一种基于强化学习和凸优化的混合框架用于基于无人机的自主元宇宙数据采集

本文提出了一种无人机辅助的 Metaverse 网络系统模型，通过资源分配和轨迹控制来提高数据收集效率，采用强化学习和凸优化的混合框架来解决时间依赖性优化问题，仿真结果表明该框架能够在给定传输功率资源下减少任务完成时间。

May, 2023

机器学习增强的无人机反射表面轨迹与无源波束成形设计

提出一种新的框架，通过在无人机网中部署 RIS 进行服务质量的提升，采用非正交多址技术进一步提高网络的频谱效率，设计深度 Q - 网络算法来解决能源消耗最小化问题。

Oct, 2020

基于分布式多智能体元学习的无线无人机网络轨迹设计

本研究采用基于价值分解的强化学习算法来解决能量限制多个无人机在动态无线网络环境下的航迹规划问题，以最大化无人机服务的用户群组覆盖率，并通过元学习机制优化算法的性能。仿真结果显示，该算法相较于基准多智能体算法，能够分别提高 53.2% 的服务覆盖率和 30.6% 的收敛速度，并且在面对之前未见过的任务时，元学习可提高算法的收敛速度高达 53.8％。

Dec, 2020

多无人机网络中的强化学习：部署和移动设计

该论文提出了一个新的框架，用于质量体验驱动的多个无人机的部署和动态移动，并使用遗传算法 K-means 算法和 Q-learning 算法实现了解决非凸 3D 部署和运动问题。

Apr, 2019

自主无人机导航的强化学习应用：系统综述

该研究探讨了使用强化学习算法解决无人机导航问题，讨论了不同环境下的算法特性和选择，并提出未来的研究方向。

Aug, 2022

多智能体强化学习用于协作无人机卸载蜂窝通信

通过多代理强化学习框架，本研究介绍了一种有效利用多个无人机最大化地满足用户对数据传输的需求的方法，其中重点是在服务质量约束下共同优化无人机轨迹和用户关联指标。

Feb, 2024