面向下一代 HetNets 的多层次多智能体 DRL 框架：联合多 RAT 分配和动态资源分配

Feb, 2022

面向下一代 HetNets 的多层次多智能体 DRL 框架：联合多 RAT 分配和动态资源分配

Hierarchical Multi-Agent DRL-Based Framework for Joint Multi-RAT Assignment and Dynamic Resource Allocation in Next-Generation HetNets

PDF

Abdulmalik Alwarafy, Bekir Sait Ciftler, Mohamed Abdallah, Mounir Hamdi, Naofal Al-Dhahir

TL;DR本文提出了一个基于分阶段多代理深度强化学习框架 DeepRAT 来解决下一代异构无线网络中成本感知的下行总速率最大化的问题。通过模拟实现，我们证明各种 DRL 代理的有效互动，学习系统动态并导出全局最优策略，同时也证明了 DeepRAT 算法在网络效用方面优于现有的最先进的启发式方法，并进一步量化了 DeepRAT 模型在快速适应网络动态、例如设备的移动方面的能力。

Abstract

This paper considers the problem of cost-aware downlink sum-rate maximization via joint optimal radio access technologies (RATs) assignment and power allocation in next-generation heterogeneous wireless networks

next-generation heterogeneous wireless networks radio access technologies deep reinforcement learning power allocation network utility

发现论文，激发创造

一个用于多小区网络下行功率分配的深度 Q 学习方法

本文提出了一种基于深度强化学习的下行功率分配方案，旨在最大化总网络吞吐量，该方案与传统的功率分配方案相比表现更好，在多小区场景中，通过深度 Q 学习方法实现近似最优功率分配策略，使用遗传算法作为基准来获得近似最优功率分配解。

Apr, 2019

多智能体学习调度：一种分布式无线资源管理框架

提出了一种使用多智能体深度强化学习的机制来管理无线电资源，从而在最大化用户吞吐量和保证公平分配资源之间取得平衡。

Jun, 2019

分布式和非协同认知无线电资源分配的深度强化学习

本文提出了一种分布式的深度强化学习资源分配技术，针对协作无线电网络所呈现的多智能体环境及其强化学习过程中可能导致的非平稳环境，通过考虑深度强化学习的特定方面，本文的算法能够迭代地收敛于一个平衡政策，其可用于无需与其他代理协调配合的情况下工作。仿真结果表明，与等效的基于 Q 表的 Q 学习算法相比，所提出的技术具有更快的学习性能，并能够在足够长的学习时间内在 99% 的情况下找到最优策略。此外，对于与等效的基于表格的实现相比，仿真结果显示出我们的 DQL 方法只需要不到一半的学习步骤才能实现相同的性能。此外，证明了在未协调交互的多无线电情景中使用标准的单智能体深度强化学习方法可能无法收敛。

May, 2022

无线网络中动态功率分配的多智能体深度强化学习

本文提出了一种分布式执行的动态功率分配方案，基于无模型深度强化学习技术，通过收集 CSI 和服务质量（QoS）信息，每个发射机适应自己的发射功率，旨在最大化加权和速效用函数，可特化为实现最大总速率或比例公平调度。本方案特别适用于系统模型不精确，CSI 延迟不可忽略的实际场景，能够在真实时间内实现几乎最优的功率分配。

Aug, 2018

分布式非协调认知无线电资源分配的深度强化学习

本文提出了一种基于深度强化学习的分布式资源分配技术，用于多代理环境下的认知无线电网络，该网络通过干扰下动态频谱访问与主干网络共存。该技术是分布式的，且不需要与其他代理协调，通过模拟结果可以显示出，该技术能够在有限的学习时间内，找到使性能在 3％之内的策略。

Oct, 2019

多用户蜂窝网络的功率分配：深度强化学习方法

本文研究了基于深度强化学习的无模型无需解析解的动力控制方案在跨单元合作、离线 / 在线集中训练和分布式执行等方面的数学分析和具体实现。分析和仿真结果表明，DRL 设计在性能、鲁棒性和广泛可用性方面优于基于模型的方法，特别是 actor-critic 深度确定性策略梯度算法，可用于现有资源分配方案。

Jan, 2019

MC-NOMA 的联合资源管理：一种深度强化学习方法

本文提出了基于深度强化学习的联合资源管理方法来应对多载波非正交多址系统中的硬件敏感性和不完美连续干扰消除，包括对子载波赋值和功率分配两个迭代子任务的决策过程。经过广泛实验验证，该方法在系统吞吐量和抗干扰能力方面较现有替代方案更加优越，并可以灵活满足用户的个性化服务要求。

Mar, 2021

多用户蜂窝网络中的功率分配策略 —— 基于深度 Q 学习方法

本文研究了基于模型驱动的电力分配算法在具有干扰多接入信道（IMAC）的无线蜂窝网络中的应用。通过深度强化学习（DRL）的两步训练框架，采用深度 Q 网络（DQN）和深度 Q 学习算法（DQL）从离线学习中获得指定数据集，而对于在线学习过程中的真实数据来说，DQN 可进一步微调。这种方法比现有的 DQL 训练方法更好，具有很好的推广能力。

Dec, 2018

多业务网络中基于 QoS 限制的资源分配的深度强化学习

本文旨在研究一种利用强化学习算法在无线多业务系统中处理无线电资源分配问题的方法，通过在本地环境中与局部互动来寻找策略，实现了关于 9LTE 系统满足保证和 QoS 约束的无线资源分配。此外，通过计算模拟，本文与文献中的最新解决方案进行比较，并展示了后者在吞吐量和故障率方面近乎最优的性能。

Mar, 2020

基于多智能体深度强化学习的无线网络资源管理

本文提出了使用多智能体深度强化学习机制的分布式资源管理和干扰抑制方案。该框架通过使智能体作出决策，从而解决了干扰和资源分配的问题。模拟结果表明，这种方法具有比分散式基线更高的性能，在与集中式信息论基线相媲美的同时，模型的鲁棒性得到了验证。

Feb, 2020