BriefGPT.xyz
May, 2025
大型语言模型的群体智能基准测试
Benchmarking LLMs' Swarm intelligence
HTML
PDF
Kai Ruan, Mowen Huang, Ji-Rong Wen, Hao Sun
TL;DR
本研究解决了大型语言模型在多智能体系统中,当面临局部感知和通信限制时,如何应对群体智能的挑战。提出了一个新颖的评估工具SwarmBench,旨在系统性地评估大型语言模型作为去中心化智能体的群体智能能力。实验证明,在这些条件下,尽管出现了一定的协调,但在不确定性环境中的稳健规划和策略形成存在明显的局限性。
Abstract
Large Language Models
(LLMs) show potential for complex reasoning, yet their capacity for emergent coordination in
Multi-Agent Systems
(MAS) when operating under strict constraints-such as limited local perceptio
→