优化稀疏通信拓扑的多智体辩论
本研究将多智能体辩论的概念扩展到更一般的网络拓扑结构,衡量了问题回答的准确性、影响力、共识以及偏见对集体的影响。结果表明,随机网络与全连接网络效果相似,但使用的令牌数量显著较少。此外,智能体之间存在平衡,自我反思在局部互动出错时有助于解答正确,而局部互动在智能体本身出错时起到帮助作用。偏见在系统性能中起到重要作用,具有正确偏见的中心节点能提升系统性能。这些发现表明,在多智能体系统中使用随机网络或具有知识的智能体位于中心位置的无标度网络可以提高整体性能。
Jun, 2024
该论文介绍了一种新方法,即通过多个语言模型实例的反复辩论和推理过程,以达成一个共同的最终答案,从而改善语言响应的表现,特别是在数学和策略推理方面,改善了已有模型中一些常见问题,如虚假答案和幻觉现象,并有望显著提高大型语言模型的性能和开拓语言生成和理解领域。
May, 2023
通过引入 CommFormer,将多个智能 Agent 之间的通讯架构视为可学习的图形,采用连续松弛和关注机制的方式,在协作任务上优化通讯图并通过梯度下降同时完善架构参数,证实了模型在不同合作场景下,无论 Agent 数量的变化,都能协调更好且更复杂的策略。
May, 2024
评估模型网络在对抗影响下通过辩论进行合作时的行为,探索推理时间方法生成更令人信服的论点,并评估基于提示的缓解作为一种防御策略的潜力。
Jun, 2024
本研究提出了一种基于去中心化 P2P BOINC 通用计算任务分配、多智能体通信协议和以太坊区块链为动力的智能合约奖励技术,可用作分布式 P2P 计算能力市场,并且具有学习最有效的软硬件组合使用和优化的潜力。
Feb, 2017
该研究提出了一种基于图卷积和多因素策略梯度的架构,用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题,并在一系列任务中取得了优异表现。
Apr, 2020
本篇论文基于 CTDE 框架,研究基于 MAPPO 算法的多智能体合作决策,并引入了基于权重调度和注意力机制的多智能体通信机制以缓解多智能体环境中的非稳定性。提出了 MCGOPPO 算法,并在 SMAC 和 MPE 上进行了实验,结果表明此算法可以改善多智能体环境中的非稳定性,提高多智能体间的协同决策能力。
May, 2023