综合接入回传网络的多智能体强化学习网络路由

May, 2023

综合接入回传网络的多智能体强化学习网络路由

Multi-Agent Reinforcement Learning for Network Routing in Integrated Access Backhaul Networks

Shahaf Yamin, Haim Permuter

TL;DR本研究主要探讨无线路由方案的优化，特别关注于集成接入回程（IAB）网络，旨在通过采取多智能体强化学习和马尔可夫决策过程等方法，最大化分组到达比率同时最小化网络延迟，并提升网络效率。在本研究中，我们提出了一种称为关系型优势演员评论家（Relational A2C）的算法，并对其进行了三种不同的训练范式。研究结果表明，相较于其他强化学习算法，该算法具有更好的性能和更低的个体自私行为，为 IAB 网络的路由策略优化提供了新的思路。

Abstract

We investigate the problem of wireless routing in integrated access backhaul (IAB) networks consisting of fiber-connected and wireless base stations and multiple users. The physical constraints of these networks prevent the use of a central controller, and base stations have limited ac

wireless routing integrated access backhaul networks multi-agent reinforcement learning markov decision process network efficiency

发现论文，激发创造

面向无线网络协议合成的多智能体强化学习

本文提出了一个基于多智能体强化学习的中介访问框架，使用强化学习解决无线网络中的访问问题，通过调整 MAC 层传输概率来实现最优负载并适应时间变化的负载，同时保持对异构负载的不可知性。

Feb, 2021

网络代理的去中心化多智能体强化学习：最新进展

本文回顾了多智能体强化学习的一个分支领域 —— 网络化智能体下的去中心化多智能体强化学习。该领域的研究主要集中在多个代理在公共环境中执行顺序决策，而无需任何中央控制器的协调。代理可以通过通信网络与其邻居交换信息。此设置在机器人，无人驾驶车辆，移动传感器网络和智能电网的控制和操作中具有广泛应用。

Dec, 2019

面向 5G 多 MAP 网络的动态灵活三维操作的联邦式多智能体深度强化学习

本文提出了一种基于两级层次结构的管理方法，结合统一接入 - 回传约束、联邦式机器学习和双注意力深度强化学习模型，在考虑移动接入点规划的同时，优化无人机的部署和网络结构设计，提高 5G 网络中移动接入点的效率。

Jun, 2023

基于图形的多智能体强化学习的协同信息传播学习

利用多智能体强化学习的分散式 POMDP 方法，通过图卷积强化学习和动态注意力技术实现信息传播，提供了可靠的协作信息传播解决方案。

Aug, 2023

多智能体深度强化学习用于大规模交通信号控制

本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法，以提高城市交通网络中的自适应交通信号控制的可观测性和减少学习难度，并在大型合成交通网格和摩纳哥城的大型实际交通网络下，通过模拟高峰流量动态，并将其与独立 A2C 和独立 Q-learning 算法进行比较，结果表明其优化性、鲁棒性和样本效率优于其他最先进的去中心化 MARL 算法。

Mar, 2019

网络系统控制的多智能体强化学习

本文研究了网络系统控制中的多智能体强化学习问题，提出了基于空间折扣因子的 NMARL 问题并引入了一种可微的通信协议 NeurComm 以提高学习效率和控制性能。实验结果表明，合适的空间折扣因子可以有效提高 MARL 算法的非通讯性学习曲线，而 NeurComm 在学习效率和控制性能方面均优于现有的通信协议。

Apr, 2020

基于多智能体强化学习的分布式自主交叉口管理方法

提出了一个使用多智能体强化学习（MARL）的分布式方法来解决自主交叉口管理（AIM）中的问题，利用 3D 环视技术实现了无需中央控制器的精确导航，同时引入了优先情景回放策略以提高训练效果。实验证明该方法作为传统中央化 AIM 技术的创新替代方案，在 SMARTS 平台的虚拟环境中超越了各种度量指标的基准。

May, 2024

智能信息聚合推进可扩展多智能体强化学习

我们提出了 InforMARL，一种新的多智能体强化学习体系结构，用于解决当观察到的只是每个智能体的局部邻域时的多智能体导航和避碰问题。该系统使用图神经网络聚合智能体的本地邻域信息，分别用于演员和评论家，能与任何标准的多智能体强化学习算法配合使用，并在测试中证明了其在环境具有任意数量的智能体和障碍物的情况下表现出良好的可扩展性。

Nov, 2022

集成卫星地面网络的动态路由：一种受限多智能体强化学习方法

通过提出一种名为 CMADR 的新型约束多智能体强化学习动态路由算法，以高效地平衡目标改进与约束满足，该算法能有效减少数据包延迟最少 21% 和 15%，并满足严格的能量消耗和丢包率要求，优于多个基准算法。

Dec, 2023

多智能体强化学习介绍及其在自主移动中的应用综述

该论文介绍了多智能体强化学习在自主移动中的应用，包括行为规划、车辆之间通信、性能提升等方面，并探讨了该领域的一些最新方法和想法。

Mar, 2022