Feb, 2022

面向下一代 HetNets 的多层次多智能体 DRL 框架:联合多 RAT 分配和动态资源分配

TL;DR本文提出了一个基于分阶段多代理深度强化学习框架 DeepRAT 来解决下一代异构无线网络中成本感知的下行总速率最大化的问题。通过模拟实现,我们证明各种 DRL 代理的有效互动,学习系统动态并导出全局最优策略,同时也证明了 DeepRAT 算法在网络效用方面优于现有的最先进的启发式方法,并进一步量化了 DeepRAT 模型在快速适应网络动态、例如设备的移动方面的能力。