基于双重 Q 学习的面向 3D 用户的无人机蜂窝网络优化轨迹设计

MMFeb, 2019

基于双重 Q 学习的面向 3D 用户的无人机蜂窝网络优化轨迹设计

Optimized Trajectory Design in UAV Based Cellular Networks for 3D Users: A Double Q-Learning Approach

Xuanlin Liu, Mingzhe Chen, Changchuan Yin

TL;DR本文研究了无人机轨迹设计的优化问题，旨在最大化服务于用户的数量，提出了一种基于双 Q 学习算法的机器学习框架来解决这个问题，并且模拟结果表明，该算法与传统的学习算法相比，可以使用户的满意度获得高达 19.4% 的增长。

Abstract

In this paper, the problem of trajectory design of unmanned aerial vehicles (UAVs) for maximizing the number of satisfied users is studied in a UAV based →

unmanned aerial vehicles trajectory design cellular network machine learning q-learning

发现论文，激发创造

多无人机辅助无线网络的轨迹设计与功率控制：一种机器学习方法

本研究提出了一种基于用户移动信息预测的多无人机轨迹设计的新框架，其利用机器学习技术为多个无人机实现位置信息获取和轨迹设计，并通过多智能体 Q 学习算法实现对其位置的预测与优化。同时，数值结果表明所提出的多智能体 Q 学习算法的轨迹设计和功率控制算法可以在较小的条件下收敛，并且可以实现 17％左右的吞吐量改进。

Dec, 2018

多无人机网络中的强化学习：部署和移动设计

该论文提出了一个新的框架，用于质量体验驱动的多个无人机的部署和动态移动，并使用遗传算法 K-means 算法和 Q-learning 算法实现了解决非凸 3D 部署和运动问题。

Apr, 2019

使用强化学习设计蜂窝网络连接的无人机路径

本文研究了无人机的路径设计问题，提出了一种新的基于强化学习的算法，通过学习相应的 MDP 的状态 - 价值函数来求解，并使用瓦片编码对大状态空间进行处理。该算法使用原始测量或仿真生成的信号强度作为输入，可适用于在线和离线实现，并成功地避免了城市环境中蜂窝网络的覆盖漏洞。

May, 2019

多智能体强化学习用于协作无人机卸载蜂窝通信

通过多代理强化学习框架，本研究介绍了一种有效利用多个无人机最大化地满足用户对数据传输的需求的方法，其中重点是在服务质量约束下共同优化无人机轨迹和用户关联指标。

Feb, 2024

基于协作强化学习的无人机（UAV）三维轨迹设计及跟踪

本文研究使用一个主动无人机和四个被动无人机实时定位一个三维目标无人机的问题，并提出了基于 Z 函数分解的强化学习方法，通过优化无人机的轨迹和主动无人机的发送功率，以最大化目标无人机的定位精度。仿真结果表明，所提出的 ZD-RL 方法相对于 VD-RL 和独立深度 RL 方法，可以减小定位误差多达 39.4% 和 64.6%。

Jan, 2024

基于深度强化学习的无人机三维轨迹与数据采集优化

本文旨在通过设计并运用基于最短路径的无人机来提升物联网设备数据的收集和资源分配。同时，设计了一个基于深度强化学习的技术来获取特定区域内的最优轨迹和吞吐量，从而实现了无人机自主收集所有数据的目标，而且显著提高了总速率，最小化了关联资源的使用。实验结果证实了方案在效率、轨迹、时间等方面的优势。

Jun, 2021

细胞无人机互联网的强化学习：协议设计、轨迹控制和资源管理

该文介绍了在 UAVs 的 cellular IoT 环境下，使用分布式的 sense-and-send 协议协调 UAVs 进行感知和传输，并应用强化学习解决轨迹控制和资源管理等关键问题的方法。

Nov, 2019

多无人机网络联合轨迹和通信设计

本文研究了基于多架无人机构成的无线通信系统，通过优化多用户通信调度与关联，无人机的轨迹与发射功率控制，最大程度地提高地面用户的最小吞吐量。提出了适用于非凸优化问题的迭代算法，实现了用户调度、无人机轨迹和发射功率的交替优化，并对问题的收敛性和复杂度进行了分析。仿真结果表明，与其他基准方案相比，该优化设计能极大地提升吞吐量。

May, 2017

基于分布式多智能体元学习的无线无人机网络轨迹设计

本研究采用基于价值分解的强化学习算法来解决能量限制多个无人机在动态无线网络环境下的航迹规划问题，以最大化无人机服务的用户群组覆盖率，并通过元学习机制优化算法的性能。仿真结果显示，该算法相较于基准多智能体算法，能够分别提高 53.2% 的服务覆盖率和 30.6% 的收敛速度，并且在面对之前未见过的任务时，元学习可提高算法的收敛速度高达 53.8％。

Dec, 2020

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020