Mar, 2024

大型语言模型应通过行为模拟成为复杂人类系统的专家顾问

TL;DR在本文中,我们探讨了大型语言模型(LLMs)在复杂人类系统中的推理能力,并提出了一种新的推理框架 ——“Mosaic Expert Observation Wall”(MEOW),利用生成型代理模拟技术。通过模拟数据训练一个专家模型,该模型在每个独立的模拟时间中专注于某个特定任务的 “经验”,通过模拟积累的 “经验” 使其成为复杂人类系统中某个任务的专家。我们在模拟真实世界安全场景的通信游戏中进行了实验,结果表明我们提出的方法可以与现有方法协同工作,增强大型语言模型在复杂人类系统中的推理能力。