基于图注意力机制的多无人机辅助通信中轨迹规划和资源分配的强化学习

Jan, 2024

基于图注意力机制的多无人机辅助通信中轨迹规划和资源分配的强化学习

Graph Attention-based Reinforcement Learning for Trajectory Design and Resource Assignment in Multi-UAV Assisted Communication

PDF

Zikai Feng, Di Wu, Mengxing Huang, Chau Yuen

TL;DR该论文提出了一种新的图注意多智能体信任域（GA-MATR）强化学习框架，用于解决多无人机辅助通信问题，通过引入图递归网络处理和分析通信网络的复杂拓扑结构，从观测信息中提取有用的信息和模式，提供额外的权重，并利用批评网络准确评估无人机基站行为的价值，以实现更可靠的反馈信号，并帮助演员网络更有效地更新策略。模拟实验表明，该方法具有优于基准线的收敛性能，无人机基站学习到了达到最大累积奖励的最佳通信策略，同时，多智能体信任域方法具有单调收敛性，为多无人机辅助通信马尔可夫博弈提供了估计的纳什均衡点。

Abstract

In the multiple unmanned aerial vehicle (UAV)- assisted downlink communication, it is challenging for uav base stations (UAV BSs) to realize trajectory design and resource assignment in unknown environments. The

unmanned aerial vehicle uav base stations reinforcement learning graph-attention multi-agent trust region communication markov game

发现论文，激发创造

基于注意力机制的实时无人机语义通信强化学习

本文研究了移动地面用户的空地超可靠低延迟通信问题，提出了一种名为 GAXNet 的多智能体深度强化学习框架，通过避免无人机之间的碰撞来控制多个无人机，从而实现低误差率和低延迟。

May, 2021

多智能体强化学习用于协作无人机卸载蜂窝通信

通过多代理强化学习框架，本研究介绍了一种有效利用多个无人机最大化地满足用户对数据传输的需求的方法，其中重点是在服务质量约束下共同优化无人机轨迹和用户关联指标。

Feb, 2024

基于多智能体强化学习的无人机网络资源分配

本文探讨了使用无人机作为空中基站提供无线通信服务的动态资源分配问题，并通过多智能体强化学习框架实现了长期收益的最大化。研究结果表明，该算法在信息交互开销和性能提升之间取得了良好的平衡。

Oct, 2018

多智能体深度强化学习在多无人机辅助移动边缘计算中的轨迹规划应用

提出一种无人机辅助的移动边缘计算框架，采用多智能体深度强化学习算法来优化无人机的轨迹，同时通过低复杂度方法优化用户设备的卸载决策。该解决方案相较于传统算法在服务用户设备公平性、无人机负载公平性和所有用户设备的能耗上性能表现较好。

Sep, 2020

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

基于 MADRL 的无人机轨迹设计及在车联网中的防碰撞机制

在未来的 6G 网络中，无人机作为移动基站将发挥基础作用，特别是在车联网 (V2X) 应用中。本文提出了一种基于排名的二进制掩码方法，以解决多个无人机协作服务同一区域时的碰撞问题，提高训练性能并满足安全约束。

Jan, 2024

密度感知强化学习优化无人机辅助网络能效

该论文提出了一种密度感知的通信多智能体去中心化双重深度 Q 网络方法，它最大化了每个无人机的轨迹、已连接用户数量和无人机的能耗，同时跟踪密集和不均匀的用户分布。该方法优于现有技术 65％-85％的能源效率。

Jun, 2023

具有图卷积通信的反事实多智体强化学习

该研究提出了一种基于图卷积和多因素策略梯度的架构，用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题，并在一系列任务中取得了优异表现。

Apr, 2020

基于深度强化学习的车联网边缘计算多接入调度

利用无人机辅助多智能体图卷积深度强化学习算法，实现车道上物联网设备最大化的用户体验，并在仿真中取得了良好的性能。

Feb, 2022

多无人机辅助无线网络的轨迹设计与功率控制：一种机器学习方法

本研究提出了一种基于用户移动信息预测的多无人机轨迹设计的新框架，其利用机器学习技术为多个无人机实现位置信息获取和轨迹设计，并通过多智能体 Q 学习算法实现对其位置的预测与优化。同时，数值结果表明所提出的多智能体 Q 学习算法的轨迹设计和功率控制算法可以在较小的条件下收敛，并且可以实现 17％左右的吞吐量改进。

Dec, 2018