Apr, 2024

PLAYER*: 提高基于 LLM 的多智能体通讯与互动在谋杀推理游戏中的效果

TL;DR基于大型语言模型(LLM)的代理通信和社交互动的最新进展,尽管这些进展,但在涉及竞争和协作的动态环境中构建面向推理的 LLM 代理仍然具有挑战性,由于受到知情图搜索方法的局限性。我们提出了 PLAYER*,这是一种基于任意采样的规划器的新型框架,它利用传感器和修剪器,为复杂的推理任务提供了一个纯问题驱动的搜索框架。我们还引入了一种可量化的评估方法,使用多项选择题构建了包含 1,482 个问答对的 WellPlay 数据集。实验证明,与现有方法相比,PLAYER * 在具有可量化结果的复杂动态环境中提供了效率和性能的改进。