DeepMPR：多智能体深度强化学习增强无线网络机会式路由

Jun, 2023

DeepMPR：多智能体深度强化学习增强无线网络机会式路由

DeepMPR: Enhancing Opportunistic Routing in Wireless Networks through Multi-Agent Deep Reinforcement Learning

Saeed Kaviani, Bo Ryu, Ejaz Ahmed, Deokseong Kim, Jae Kim...

TL;DR本研究基于多智能体深度强化学习设计了一种新的多播路由技术 DeepMPR，它在不需要邻居的多点中继广播信息的情况下，优于 OLSR MPR 选择算法，通过对比其他普及技术，展示了我们训练的 DeepMPR 多播转发策略的性能增益。

Abstract

opportunistic routing relies on the broadcast capability of wireless networks. It brings higher reliability and robustness in highly dynamic and/or severe environments such as mobile or vehicular ad-hoc networks (MANETs/VANETs). To reduce the cost of broadcast, →

opportunistic routing multicast routing connected dominating set multi-agent deep reinforcement learning mobile ad-hoc networks

发现论文，激发创造

SDWN 中基于多智能体深度强化学习的智能组播路由方法

本文提出了一种基于多智能体深度强化学习的新型组播路由方法，该方法应用于软件定义的无线网络环境中，灵活配置网络并获得网络状态信息。使用单跳动作策略和奖励函数解决多智能体合作下的多个子问题，并采用分散式训练方法相结合的迁移学习机制来加速收敛并提高吞吐量、延迟、丢包率等性能，模拟实验表明 MADRL-MR 方法可以建立更智能的组播路由。

May, 2023

DRL-M4MR: 基于 DQN 深度强化学习的智能 SDN 多播路由方法

本文采用深度强化学习（DRL）方法设计了一种基于软件定义网络（SDN）的智能组播路由算法 DRL-M4MR，该算法将最优组播路由问题视为多目标优化问题，通过构建组播树状态矩阵、链路带宽矩阵、链路延迟矩阵和链路丢包率矩阵作为 DRL 代理的状态空间，设计单步和最终奖励函数以指导智能构建最优组播树。实验结果表明，相比现有算法，DRL-M4MR 构建的组播树在训练后能够获得更好的带宽、延迟和丢包率性能，并且它能够在动态网络环境下做出更具智能的组播路由决策。

Jul, 2022

面向无线网络协议合成的多智能体强化学习

本文提出了一个基于多智能体强化学习的中介访问框架，使用强化学习解决无线网络中的访问问题，通过调整 MAC 层传输概率来实现最优负载并适应时间变化的负载，同时保持对异构负载的不可知性。

Feb, 2021

基于深度分层强化学习的智能 SDN 多播路由方法 DHRL-FNMR

该研究提出了一种基于深度分层强化学习的 SDN 智能多播路由算法来解决现有算法存在的问题，并构建了信息特征的状态空间和不同的行动空间。此外，还开发了可区分单步节点行动和多步行动向多目标节点的替代奖励策略来加速构建最优多播树的智能代理。

May, 2023

基于多智能体深度强化学习的无线网络资源管理

本文提出了使用多智能体深度强化学习机制的分布式资源管理和干扰抑制方案。该框架通过使智能体作出决策，从而解决了干扰和资源分配的问题。模拟结果表明，这种方法具有比分散式基线更高的性能，在与集中式信息论基线相媲美的同时，模型的鲁棒性得到了验证。

Feb, 2020

综合接入回传网络的多智能体强化学习网络路由

本研究主要探讨无线路由方案的优化，特别关注于集成接入回程（IAB）网络，旨在通过采取多智能体强化学习和马尔可夫决策过程等方法，最大化分组到达比率同时最小化网络延迟，并提升网络效率。在本研究中，我们提出了一种称为关系型优势演员评论家（Relational A2C）的算法，并对其进行了三种不同的训练范式。研究结果表明，相较于其他强化学习算法，该算法具有更好的性能和更低的个体自私行为，为 IAB 网络的路由策略优化提供了新的思路。

May, 2023

分布式卫星路由的多主体深度强化学习

该研究介绍了一种用于低地球轨道卫星链路的多智能体深度强化学习方法（MA-DRL），通过融合全局深度神经网络以及本地预训练 DNN，实现离线学习最优路径并快速适应网络和流量变化，在线实现高效分布式路由。

Feb, 2024

多智能体深度强化学习（MADRL）遇见多用户 MIMO 系统

本文提出了一种 MADRL 的方法，即采用 MA-DDPG 框架，在有多个决策制定者并且这些决策制定者只能观测到部分环境信息，且存在多维度动作空间的情况下，在多输入单输出干扰信道系统中联合优化预编码器，来实现可实现速率区域的边界，同时提出了一种解决相位歧义问题的训练方法（PAE），模拟结果表明这种方法在 MISO IFC 系统中可以学习到近乎最优的预编码策略，并且这是第一篇在多个蜂窝、多用户、多天线系统中证明 MA-DDPG 框架可以联合优化预编码器以达到可实现速率区域的边界的研究。

Sep, 2021

面向成本和时延敏感的虚拟网络功能部署和路由的多智能体深度强化学习

本文提出了一种基于多智能体深度强化学习的有效而新颖的方法，用于解决联合虚拟网络功能（VNF）部署和路由问题，该问题涉及多个不同需求的服务请求同时交付，并通过其延迟和成本敏感因素反映服务请求的不同需求，提出了基于参数移植的模型重新训练方法来处理网络拓扑发生更改的情况。

Jun, 2022

通过自适应图形的无线网络中的多智能体强化学习功率控制

无线网络中的动态优化策略是一个重要的研究领域，本文提出了一种使用图神经网络的方法，将分布式代理之间的动态相互作用建模，并在网络优化问题中实现了较好的泛化能力验证

Nov, 2023