Dec, 2023

解密数字侦探:了解多智能体谜题游戏中的 LLM 行为与能力

TL;DR通过应用大型语言模型(LLMs)在中国的谋杀迷题角色扮演游戏 “Jubensha” 中,我们提出了第一个专为 Jubensha 设计的中文数据集,旨在促进该复杂叙事环境下 AI 智能体的发展。本研究还介绍了一种基于 LLMs 的独特多智能体交互框架,使得这些 AI 智能体能够自主参与游戏,增强 Jubensha 游戏的动态性。为了评估这些 AI 智能体的表现,我们开发了专门针对他们对案件信息和推理能力的精研方法。此外,我们还融合了最新的上下文学习技术,以改善智能体在信息收集、凶手检测和逻辑推理等关键方面的表现。实验结果验证了我们提出方法的有效性。本研究旨在为研究者在该领域提供理解 LLM 能力的新视角,并建立一个评估基于大型语言模型的智能体的新基准。