Mar, 2023

具有动作掩蔽的多智能体强化学习在无人机移动通信中的应用

TL;DR本篇论文研究使用多个无人机作为基站,通过联合优化无人机三维轨迹和 NOMA 功率分配来最大化系统吞吐量,并使用基于加权 K-means 的聚类算法建立无人机 - 用户关联,研究表明使用共享的 Deep Q-Network 在系统吞吐量和训练时间上表现优于传统的 DQN,同时还可以收敛于具有不同动作空间的多个智能体,与 NOMA 的结合可以实现比现有基线方案更好的总速率。