EMNLPOct, 2023

通过大型语言模型实现多智能体协作的心智理论

TL;DR评估了基于大型语言模型的多智能体协作文本游戏中的理论推理任务,并与多智能体强化学习和基于计划的基准进行比较。研究发现基于大型语言模型的智能体表现出紧密合作行为和高级理论推理能力,但也存在在管理长期视野环境和任务状态幻觉方面的规划优化限制。通过利用显式信念状态表示来减轻这些问题,改善了基于大型语言模型的智能体的任务表现和理论推理准确性。