Aug, 2023

BOLAA:基准测试和编排 LLM 增强的自主代理

TL;DR大型语言模型(LLM)的巨大成功鼓舞了 LLM 增强型自主代理(LAA)的出现。LAA 能够使用其核心 LLM 生成动作并与环境交互,可以通过将过去的交互(包括观察和动作)作为条件来解决复杂任务的能力。我们提供了一个关于代理体系结构和 LLM 骨干的全面比较,同时提出了一种新的策略来编排多个 LAA,使得每个工作代理集中于一种类型的动作,即 BOLAA,其中一个控制器管理多个代理之间的通信。我们在决策制定和多步推理环境中进行了模拟,全面证明了 LAA 的能力。我们的性能结果量化地为设计 LAA 架构和 LLM 的最佳选择以及两者的兼容性提供了建议。我们将 LAA 的实现代码公开发布在 https://github.com/salesforce/BOLAA。