优化稀疏通信拓扑的多智体辩论

Jun, 2024

Improving Multi-Agent Debate with Sparse Communication Topology

PDF

Yunxuan Li, Yibing Du, Jiageng Zhang, Le Hou, Peter Grabowski...

TL;DR多代理辩论通过稀疏通信拓扑可以在大大降低计算成本的同时实现相当或更高的性能，扩展至多模态推理和对齐标注任务，强调了通信连通性对于增强 “心智集合体” 方法的效率和有效性的重要性。

Abstract

multi-agent debate has proven effective in improving large language models quality for reasoning and →

multi-agent debate communication connectivity language models reasoning factuality tasks

发现论文，激发创造

语言模型网络中的问题解决

本研究将多智能体辩论的概念扩展到更一般的网络拓扑结构，衡量了问题回答的准确性、影响力、共识以及偏见对集体的影响。结果表明，随机网络与全连接网络效果相似，但使用的令牌数量显著较少。此外，智能体之间存在平衡，自我反思在局部互动出错时有助于解答正确，而局部互动在智能体本身出错时起到帮助作用。偏见在系统性能中起到重要作用，具有正确偏见的中心节点能提升系统性能。这些发现表明，在多智能体系统中使用随机网络或具有知识的智能体位于中心位置的无标度网络可以提高整体性能。

Jun, 2024

多代理辩论对抗对抗攻击

通过多代理辩论和嵌入式聚类，我们研究了现代语言模型在对抗性攻击和多代理环境下的表现，并发现多代理辩论可以减少模型的有害性，并改善对不同类型攻击主题的抵抗能力。

Jan, 2024

通过多智能体辩论提高语言模型的事实性和推理能力

该论文介绍了一种新方法，即通过多个语言模型实例的反复辩论和推理过程，以达成一个共同的最终答案，从而改善语言响应的表现，特别是在数学和策略推理方面，改善了已有模型中一些常见问题，如虚假答案和幻觉现象，并有望显著提高大型语言模型的性能和开拓语言生成和理解领域。

May, 2023

从图模型视角学习多智能体通信

通过引入 CommFormer，将多个智能 Agent 之间的通讯架构视为可学习的图形，采用连续松弛和关注机制的方式，在协作任务上优化通讯图并通过梯度下降同时完善架构参数，证实了模型在不同合作场景下，无论 Agent 数量的变化，都能协调更好且更复杂的策略。

May, 2024

多智能体协作攻击：通过辩论研究大规模语言模型协作中的对抗攻击

评估模型网络在对抗影响下通过辩论进行合作时的行为，探索推理时间方法生成更令人信服的论点，并评估基于提示的缓解作为一种防御策略的潜力。

Jun, 2024

超越谱隙：拓扑在分散式学习中的作用

研究了具有罕见连接的分布式机器学习优化问题，提出了理论解释，解释了合作可以获得比训练单独更大的学习率，并描述了不同图形拓扑的相对优点。

Jun, 2022

多智能体系统与分散式人工超智能

本研究提出了一种基于去中心化 P2P BOINC 通用计算任务分配、多智能体通信协议和以太坊区块链为动力的智能合约奖励技术，可用作分布式 P2P 计算能力市场，并且具有学习最有效的软硬件组合使用和优化的潜力。

Feb, 2017

具有图卷积通信的反事实多智体强化学习

该研究提出了一种基于图卷积和多因素策略梯度的架构，用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题，并在一系列任务中取得了优异表现。

Apr, 2020

基于深度强化学习的多智能体通信与协作决策研究

本篇论文基于 CTDE 框架，研究基于 MAPPO 算法的多智能体合作决策，并引入了基于权重调度和注意力机制的多智能体通信机制以缓解多智能体环境中的非稳定性。提出了 MCGOPPO 算法，并在 SMAC 和 MPE 上进行了实验，结果表明此算法可以改善多智能体环境中的非稳定性，提高多智能体间的协同决策能力。

May, 2023

朝着基于多智能体通信的语言学习

提出了一种交互式多模态框架，通过协作推理游戏，实现神经网络学习语言，初步实验结果可喜，但需注意避免智能体发展出仅针对游戏有效的特定通信编码。

May, 2016