具有动作掩蔽的多智能体强化学习在无人机移动通信中的应用

Mar, 2023

具有动作掩蔽的多智能体强化学习在无人机移动通信中的应用

Multi-Agent Reinforcement Learning with Action Masking for UAV-enabled Mobile Communications

Danish Rizvi, David Boyle

TL;DR本篇论文研究使用多个无人机作为基站，通过联合优化无人机三维轨迹和 NOMA 功率分配来最大化系统吞吐量，并使用基于加权 K-means 的聚类算法建立无人机 - 用户关联，研究表明使用共享的 Deep Q-Network 在系统吞吐量和训练时间上表现优于传统的 DQN，同时还可以收敛于具有不同动作空间的多个智能体，与 NOMA 的结合可以实现比现有基线方案更好的总速率。

Abstract

unmanned aerial vehicles (UAVs) are increasingly used as aerial base stations to provide ad hoc communications infrastructure. Building upon prior research efforts which consider either static nodes, 2D trajector

unmanned aerial vehicles ad hoc communications infrastructure noma power allocation shared deep q-network, multi-agent system

发现论文，激发创造

机器学习增强的无人机反射表面轨迹与无源波束成形设计

提出一种新的框架，通过在无人机网中部署 RIS 进行服务质量的提升，采用非正交多址技术进一步提高网络的频谱效率，设计深度 Q - 网络算法来解决能源消耗最小化问题。

Oct, 2020

多智能体强化学习用于协作无人机卸载蜂窝通信

通过多代理强化学习框架，本研究介绍了一种有效利用多个无人机最大化地满足用户对数据传输的需求的方法，其中重点是在服务质量约束下共同优化无人机轨迹和用户关联指标。

Feb, 2024

量子多智能体 Actor-Critic 网络在多 UAV 系统中用于合作移动接入

本研究提出了一种量子多智能体 actor-critic 网络算法用于利用多个无人机自主构建强壮的移动接入系统，该模型通过量子计算和 MARL 方法获得了较好的性能，并提出了一个噪声注入方案来处理环境不确定性。

Feb, 2023

密度感知强化学习优化无人机辅助网络能效

该论文提出了一种密度感知的通信多智能体去中心化双重深度 Q 网络方法，它最大化了每个无人机的轨迹、已连接用户数量和无人机的能耗，同时跟踪密集和不均匀的用户分布。该方法优于现有技术 65％-85％的能源效率。

Jun, 2023

基于多智能体强化学习的无人机网络资源分配

本文探讨了使用无人机作为空中基站提供无线通信服务的动态资源分配问题，并通过多智能体强化学习框架实现了长期收益的最大化。研究结果表明，该算法在信息交互开销和性能提升之间取得了良好的平衡。

Oct, 2018

基于 MADRL 的无人机轨迹设计及在车联网中的防碰撞机制

在未来的 6G 网络中，无人机作为移动基站将发挥基础作用，特别是在车联网 (V2X) 应用中。本文提出了一种基于排名的二进制掩码方法，以解决多个无人机协作服务同一区域时的碰撞问题，提高训练性能并满足安全约束。

Jan, 2024

无人机辅助混合行动增强学习的语义通信

本研究旨在探索使用助理无人机的上行语义通信，以提高偏远地区元宇宙用户的数据采集效率。为了在重建质量和计算能量成本之间平衡的同时减少上行数据采集时间，我们提出了一种混合动作强化学习框架，用于在语义模型规模、信道分配、传输功率和无人机轨迹上做出决策。变量分为离散类型和连续类型，并由两个不同的强化学习代理进行优化以生成合并的动作。模拟结果表明，所提出的混合动作强化学习框架可以在不同的参数设置下有效提高上行语义数据采集的效率，并优于基准情况。

Aug, 2023

利用深度强化学习实现无人机的同时导航和无线电映射

本文提出了一种基于深度强化学习的覆盖感知导航方法，该方法利用移动无人机的可控机动性设计其导航 / 轨迹，避免了蜂窝基站覆盖漏洞，并提出了一种同时导航和无线电映射的框架。该模型通过深度 Q 网络（DQN）预测位置的中断概率，并预测期望回报，从而使得机器人学习效率大幅提升。

Mar, 2020

基于非正交多址接入的无人机通信

本文提出了基于非正交多址（NOMA）的无人机（UAV）网络的新框架，通过三个案例研究，旨在从基本理论到实际实现全面了解 UAV 系统，其中包括采用随机几何模型对 NOMA 启用的 UAV 网络进行性能评估，研究基于简化的二维模型的静态 NOMA 用户联合轨迹设计和功率分配问题，以及展示机器学习技术在处理 UAV 位置问题时的应用。

Sep, 2018

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020