Jan, 2024

基于图注意力机制的多无人机辅助通信中轨迹规划和资源分配的强化学习

TL;DR该论文提出了一种新的图注意多智能体信任域(GA-MATR)强化学习框架,用于解决多无人机辅助通信问题,通过引入图递归网络处理和分析通信网络的复杂拓扑结构,从观测信息中提取有用的信息和模式,提供额外的权重,并利用批评网络准确评估无人机基站行为的价值,以实现更可靠的反馈信号,并帮助演员网络更有效地更新策略。模拟实验表明,该方法具有优于基准线的收敛性能,无人机基站学习到了达到最大累积奖励的最佳通信策略,同时,多智能体信任域方法具有单调收敛性,为多无人机辅助通信马尔可夫博弈提供了估计的纳什均衡点。