May, 2025

大型语言模型的群体智能基准测试

TL;DR本研究解决了大型语言模型在多智能体系统中,当面临局部感知和通信限制时,如何应对群体智能的挑战。提出了一个新颖的评估工具SwarmBench,旨在系统性地评估大型语言模型作为去中心化智能体的群体智能能力。实验证明,在这些条件下,尽管出现了一定的协调,但在不确定性环境中的稳健规划和策略形成存在明显的局限性。