基于共识导向的多智能体通信的分散自适应编队

Jul, 2023

基于共识导向的多智能体通信的分散自适应编队

Decentralized Adaptive Formation via Consensus-Oriented Multi-Agent Communication

Yuming Xiang, Sizhao Li, Rongpeng Li, Zhifeng Zhao, Honggang Zhang

TL;DR提出了一种新的 Cons-DecAF 框架，通过使用 ConsMAC 方法进行多智能体强化学习，利用策略蒸馏实现自适应编队调整，并采用基于 Hausdorff 距离的位移式编队，取得了出色的速度和稳定性表现。

Abstract

adaptive multi-agent formation control, which requires the formation to flexibly adjust along with the quantity variations of agents in a decentralized manner, belongs to one of the most challenging issues in multi-agent systems, especially under communication-limited constraints. In t

adaptive multi-agent formation control cons-decaf framework consmac policy distillation displacement-based formation

发现论文，激发创造

合作多智体强化学习的共识学习

本研究提出了一种协作多智能体强化学习的共识学习方法，通过基于本地观察的共识学习，在分散式执行期间将推断出来的共识明确地作为智能体网络的输入，从而发展他们的合作精神，并在若干完全合作任务上获得了令人信服的结果。

Jun, 2022

基于深度强化学习的多智能体通信与协作决策研究

本篇论文基于 CTDE 框架，研究基于 MAPPO 算法的多智能体合作决策，并引入了基于权重调度和注意力机制的多智能体通信机制以缓解多智能体环境中的非稳定性。提出了 MCGOPPO 算法，并在 SMAC 和 MPE 上进行了实验，结果表明此算法可以改善多智能体环境中的非稳定性，提高多智能体间的协同决策能力。

May, 2023

动态网络桥接的分布式自主群体形成

机器人系统，群体操作，网络桥接，多智能体强化学习和实际应用转化的问题和方法。

Apr, 2024

强化学习与主动防御的鲁棒通信多智能体系统

多智能体强化学习中的通信经实验证明能有效促进代理之间的合作，然而，由于现实场景中通信容易受到干扰和攻击，因此开发鲁棒通信技术至关重要。本文提出了一种主动防御策略，使代理能够自动减少潜在有害信息对最终决策的影响。我们设计了一个主动防御多智能体通信框架（ADMAC），通过一个可分解的决策结构估计接收到的信息的可靠性，并相应地调整其对最终决策的影响。通过在四种攻击类型下进行三个通信关键任务的实验验证了 ADMAC 相对于现有方法的优越性。

Dec, 2023

可适应辅助多智能体对抗生成的通信抗干扰多智能体学习

本文提出了一种适应性的多智能体辅助对抗生成方法（Multi-Agent Auxiliary Adversaries Generation for robust Communication，MA3C）以提高多智能体强化学习中通信策略的鲁棒性，其中引入了一种新型的信息攻击方法，并采用进化学习的赋权攻击器种群生成策略，同时训练发出消息的系统和攻击器以提高其适应能力。实验证明，该方法提高了多样性和鲁棒性。

May, 2023

分散和终身自适应的多智能体协作学习

提出了 DeLAMA 算法，它是一种具有动态协作图的分散式多智能体协同学习算法，能够促进自主协作关系学习和适应动态任务，实现了 MSE 减少 98.80% 和分类准确率提高 188.87%，为未来建立智能、分散式和动态多智能体系统提供了基础技术。

Mar, 2024

具有图卷积通信的反事实多智体强化学习

该研究提出了一种基于图卷积和多因素策略梯度的架构，用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题，并在一系列任务中取得了优异表现。

Apr, 2020

多智能体强化学习系统中基于信任的共识

该论文探讨了在多智能体强化学习中存在不可靠智能体的问题以及如何实现让智能体在存在不可靠智能体的情况下达成共识，通过提出基于强化学习的可信共识机制，使智能体能够根据与它们之间的交互经验自主决定与何人通信，并取得了更高的共识成功率。

May, 2022

使用动量加速共识的去中心化深度学习

本文研究了分布式数据集下的分布式深度学习中的通信拓扑问题，提出一个基于梯度优化的 Heavy-ball 加速策略和共识协议的无中心化方法，并理论和经验上证明，在各种通信拓扑下都取得了更好的效果。

Oct, 2020

从图模型视角学习多智能体通信

通过引入 CommFormer，将多个智能 Agent 之间的通讯架构视为可学习的图形，采用连续松弛和关注机制的方式，在协作任务上优化通讯图并通过梯度下降同时完善架构参数，证实了模型在不同合作场景下，无论 Agent 数量的变化，都能协调更好且更复杂的策略。

May, 2024