Feb, 2024

可执行代码操作引发更好的 LLM 智能体

TL;DR使用可执行的 Python 代码将大型语言模型 (LLM) 代理的动作统一到一个行动空间 (CodeAct) 中,并通过多轮交互来执行代码动作、动态修订先前的动作或生成新的动作。实验结果显示,CodeAct 相较于广泛使用的其他方法在性能上表现更好,并通过构建与用户协作的开源 LLM 代理 (CodeActAgent) 展示了其在任务导向模型中的潜力。