从图模型视角学习多智能体通信

ICLRMay, 2024

Learning Multi-Agent Communication from Graph Modeling Perspective

Shengchao Hu, Li Shen, Ya Zhang, Dacheng Tao

TL;DR通过引入 CommFormer，将多个智能 Agent 之间的通讯架构视为可学习的图形，采用连续松弛和关注机制的方式，在协作任务上优化通讯图并通过梯度下降同时完善架构参数，证实了模型在不同合作场景下，无论 Agent 数量的变化，都能协调更好且更复杂的策略。

Abstract

In numerous artificial intelligence applications, the collaborative efforts of multiple intelligent agents are imperative for the successful attainment of target objectives. To enhance coordination among these ag

artificial intelligence intelligent agents distributed communication communication architecture cooperative tasks

发现论文，激发创造

具有图卷积通信的反事实多智体强化学习

该研究提出了一种基于图卷积和多因素策略梯度的架构，用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题，并在一系列任务中取得了优异表现。

Apr, 2020

When2com: 基于通信图分组的多智能体感知

本文提出一个学习通信组和决定何时通信的通信框架，可以在两种不同的感知任务上展示其广泛适用性，并显示它显著减少了通信带宽并保持了优异的性能。

May, 2020

使用反向传播算法学习多智能体通信

本文提出了一种名为 CommNet 的神经网络模型，该模型适用于多智能体协作任务。模型包含多个智能体，并且智能体之间的通信是在模型训练过程中学习的。实验证明，相互学习的智能体能够相互间进行有效通信，在协作任务上表现出更好的性能，有时可以将智能体所产生的语言解释为解决任务的简单而有效策略。

May, 2016

学习注意交流以实现多智能体协作

本文提出了一种注意力通信模型，能够学习何时需要进行通信以及如何将共享信息集成到合作决策中，以实现大规模多智能体协作的高效和有效通信，从而在合作情境中比现有方法展现出更具协调性和更复杂的策略。

May, 2018

神经符号变压器用于多智体通信

研究如何在多智能体规划问题中推断通信结构，以最小化通信量，并提出了一种结合程序化通信策略和变压器策略网络的神经符号变压器算法，能够生成低程度通信图并保持接近最优性能。

Jan, 2021

多智能体团队中可迁移合作行为的学习

提出使用共享的代理 - 实体图来建模多智能体相互作用，并利用基于图的强化学习训练代理实现协作行为，实现了对多种任务的有效解决，并展示了其泛化能力。

Jun, 2019

野火管理资源分配的图神经网络通信层协作自适应多智能体强化学习

提出一种基于多智能体强化学习和图神经网络通讯层的方法，在火灾管理资源分配中，通过通信环境特征和部分可见火灾，实现协作分配资源，优于贪心启发式基线和单智能体设置，并展示了自动课程和开放性对其泛化能力的改善。

Apr, 2022

利用代理器类信息专门化异构多智能体强化学习中的智能体间通信

该研究提出了一种使用图神经网络表示多智能体通信能力的方法，并介绍了一种神经网络架构，该架构通过学习每对智能体类别间交换消息的个体转换，从而在完整的合作异构多智能体任务中专门优化通信，并在不同智能体类别操作的环境中取得了相当或更优的性能表现。

Dec, 2020

朝着基于多智能体通信的语言学习

提出了一种交互式多模态框架，通过协作推理游戏，实现神经网络学习语言，初步实验结果可喜，但需注意避免智能体发展出仅针对游戏有效的特定通信编码。

May, 2016

用对比学习实现分散式多智能体通信的学习

研究使用自我监督学习的方法，通过最大化给定轨迹信息的消息之间的互信息，使用一种新的视角诱导出一个共同语言，在通信关键的环境中取得了更好的学习表现和速度，以及学习出比现有方法更一致的共同语言，而且不需要引入额外的学习参数。

Mar, 2022