多智能体深度强化学习（MADRL）遇见多用户 MIMO 系统

MMSep, 2021

多智能体深度强化学习（MADRL）遇见多用户 MIMO 系统

Multi-agent deep reinforcement learning (MADRL) meets multi-user MIMO systems

Heunchul Lee, Jaeseong Jeong

TL;DR本文提出了一种 MADRL 的方法，即采用 MA-DDPG 框架，在有多个决策制定者并且这些决策制定者只能观测到部分环境信息，且存在多维度动作空间的情况下，在多输入单输出干扰信道系统中联合优化预编码器，来实现可实现速率区域的边界，同时提出了一种解决相位歧义问题的训练方法（PAE），模拟结果表明这种方法在 MISO IFC 系统中可以学习到近乎最优的预编码策略，并且这是第一篇在多个蜂窝、多用户、多天线系统中证明 MA-DDPG 框架可以联合优化预编码器以达到可实现速率区域的边界的研究。

Abstract

A multi-agent deep reinforcement learning (madrl) is a promising approach to challenging problems in wireless environments involving multiple decision-makers (or actors) with high-dimensional continuous action sp

multi-agent deep reinforcement learning madrl miso interference channel precoders phase ambiguity elimination

发现论文，激发创造

用于部分可观察环境和有限通信的 R-MADDPG

本文介绍了一种使用深度循环多智能体演员 - 评论家框架（R-MADDPG）处理部分可观测设置和有限通信下多智能体协调的方法，并探究了循环效应对团队智能体表现和通信使用的影响。研究结果表明，该框架可以学习随时间变化的依赖关系，处理资源限制，并在智能体之间开发不同的通信模式。

Feb, 2020

SDWN 中基于多智能体深度强化学习的智能组播路由方法

本文提出了一种基于多智能体深度强化学习的新型组播路由方法，该方法应用于软件定义的无线网络环境中，灵活配置网络并获得网络状态信息。使用单跳动作策略和奖励函数解决多智能体合作下的多个子问题，并采用分散式训练方法相结合的迁移学习机制来加速收敛并提高吞吐量、延迟、丢包率等性能，模拟实验表明 MADRL-MR 方法可以建立更智能的组播路由。

May, 2023

极端嘈杂观测下的多智能体深度强化学习

使用通信媒介增强的多智能体深度确定性策略梯度算法在六种高度非稳态环境中表现良好，相比基线模型具有显著性能提升。

Dec, 2018

通过自适应图形的无线网络中的多智能体强化学习功率控制

无线网络中的动态优化策略是一个重要的研究领域，本文提出了一种使用图神经网络的方法，将分布式代理之间的动态相互作用建模，并在网络优化问题中实现了较好的泛化能力验证

Nov, 2023

面向成本和时延敏感的虚拟网络功能部署和路由的多智能体深度强化学习

本文提出了一种基于多智能体深度强化学习的有效而新颖的方法，用于解决联合虚拟网络功能（VNF）部署和路由问题，该问题涉及多个不同需求的服务请求同时交付，并通过其延迟和成本敏感因素反映服务请求的不同需求，提出了基于参数移植的模型重新训练方法来处理网络拓扑发生更改的情况。

Jun, 2022

基于深度强化学习的硬件受损和不完美 CSI 情况下，RIS 辅助 MU-MISO 系统中的联合下行波束赋形和 RIS 配置

本文介绍了一种基于深度强化学习（DRL）的新方法，通过联合优化 MIMO 系统中的发送波束和可重构智能表面（RIS）的相位移位，最大化相位依赖性反射幅度模型下的总下行速率。

Oct, 2022

多智能体系统的深度强化学习：挑战、解决方案和应用综述

此篇论文介绍了多智能体深度强化学习的不同方法，包括非静态性、部分可观测性、连续的状态和操作空间、多智能体训练机制、多智能体转移学习，并分析和讨论了这些方法的优缺点及其相关应用，旨在促进更加健壮和高效的多智能体学习方法的发展。

Dec, 2018

异构无线网络的深度强化学习多路访问

本文研究了深度强化学习在异构无线网络的 MAC 协议中的应用，通过观察环境、采取行动和获得回报，DLMA 节点可以学习一种最优的 MAC 策略，以实现多个时隙网络的协调共存。

Dec, 2017

深度多智能体强化学习与混合动作空间的进一步探索

本研究提出了两个基于集中式训练、分散式执行范式的深度多智能体软策略优化算法以解决混合行动空间问题，并在基本物理模拟和易于实现的多智能体环境下进行了实验验证并取得了良好的表现。

Aug, 2022

AI-Enabled 无线网络的单智能体和多智能体深度强化学习：教程

本文论述了强化学习在 AI 驱动的 6G 网络中的作用，特别是目前热门的多智能体深度强化学习方法，以及其在移动边缘计算、无人机网络和大规模无线接入等方面的最新研究进展与应用前景。

Nov, 2020