AGILE: 一种新的 LLM 智能体框架

May, 2024

AGILE: A Novel Framework of LLM Agents

Peiyuan Feng, Yichen He, Guanhua Huang, Yuan Lin, Hanchong Zhang...

TL;DR我们引入了一种名为 AGILE 的 LLM 代理的新框架，旨在通过使用 LLMs、记忆、工具和专家的互动，执行与用户进行复杂对话的任务。我们将这样的 LLM 代理的构建形式化为一种强化学习问题，其中 LLM 作为策略模型。我们通过有标记的操作数据和 PPO 算法对 LLM 进行微调，并针对问答问题发布了一个名为 ProductQA 的代理数据集。我们对 ProductQA 和 MedMCQA 进行了广泛的实验，结果表明基于 13B 和 7B LLMs 的 PPO 训练的 AGILE 代理可以胜过 GPT-4 代理。我们的消融研究突出了记忆、工具、咨询、反思和强化学习在实现代理的强大性能方面的重要性。

Abstract

We introduce a novel framework of llm agents named AGILE (AGent that Interacts and Learns from Environments) designed to perform complex conversational tasks with users, leveraging LLMs, memory, tools, and interactions with experts. The agent's abilities include not only →

agile agents llm agents conversation question answering reinforcement learning

发现论文，激发创造

多智能体协作：发挥智能 LLM 代理的力量

本文提出了一种通过多智能体系统来增强大型语言模型（LLMs）能力的新框架，并通过人工智能领域的案例研究展示了这一框架的实用性和多样性。

Jun, 2023

基于大型语言模型的游戏智能代理调查

利用 LLMs 在复杂的电脑游戏环境中赋予游戏智能体人类般的决策能力，以推进人工智能 (AGI) 的发展，并提供了 LLM 基础的游戏智能体的综述，包括感知、记忆、思考、角色扮演、行动和学习的六个关键组成部分，调研了六种游戏类型的现有代表性 LLM 基础游戏智能体，并展望了未来的研究和发展方向。

Apr, 2024

经济实惠的生成代理

大型语言模型的出现极大地推进了逼真互动代理的模拟。本研究提出了一种名为 Affordable Generative Agents（AGA）的框架，通过代理 - 环境和代理 - 代理层面上的生成，实现了具有可信度和低成本的互动。在多个环境中进行的广泛实验展示了我们提出的框架的效果和效率。通过对 LLM 代理中出现的可信行为机制进行深入分析，我们发现代理只能在固定环境中生成有限的行为，从中了解促进新型互动行为的方法。

Feb, 2024

面向基于文本的教育环境的通用智能体: RL 与 LLMs 的整合研究

通过将强化学习与大型语言模型结合，研究了在开放性文本学习环境中增强代理的泛化能力，提出了三种代理类型：基于强化学习的代理、基于大型语言模型的代理和融合两者的混合代理，以提高代理的性能和泛化能力，并通过 PharmaSimText 提供的基准测试验证了研究成果。结果表明，基于强化学习的代理在任务完成方面表现出色，但在提问诊断问题方面有所欠缺；相反，基于大型语言模型的代理在提问诊断问题方面表现较好，但在完成任务方面表现较差；而混合的大型语言模型辅助强化学习代理能够克服这些限制，凸显了将强化学习和大型语言模型相结合在开放性学习环境中开发高性能代理的潜力。

Apr, 2024

MAgIC: 大型语言模型驱动的多智能体在认知、适应性、合理性和协作方面的基准测试

这项研究介绍了一个专门用于评估大型语言模型在多主体环境中能力的基准测试框架，通过游戏和博弈论场景来创建不同的测试环境，并利用概率图模型方法增强模型的导航能力，最终量化评估了七种不同大型语言模型的能力，发现最强模型 GPT-4 和最弱模型 Llama-2-70B 之间存在三倍的能力差距，同时证实了概率图模型增强了所有模型的能力，平均提高了 50%。

Nov, 2023

专业代理 -- 将大型语言模型演变为具有人类级别能力的自主专家

大型语言模型的出现催生了自然语言处理的重大进展，通过引入专业代理框架（PAgents）利用 LLM 的能力创建具有可控、专业级、互动型专长的自主代理，我们认为通过持续发展的专业知识，PAgents 可以重塑专业服务。本文旨在激发关于 LLM 的有前景的现实应用的讨论，我们认为 PAgents 的日益复杂和集成可能会导致人工智能系统在复杂领域展示专业掌握能力，服务于重要需求，并潜在地实现人工通用智能。

Feb, 2024

探索基于大型语言模型的智能代理：定义、方法与前景

对基于大型语言模型（LLM）的智能代理进行了深入调查，涵盖了单代理和多代理系统中的定义、研究框架、组成、认知和规划方法、工具利用、对环境反馈的响应，以及在多代理系统中部署 LLM-based 代理的机制，包括多角色协作、信息传递和缓解代理之间通信问题的策略，同时介绍了流行的数据集和应用场景，最后展望了基于 LLM 的代理在人工智能和自然语言处理领域的前景。

Jan, 2024

OpenAGI: LLM 与领域专家的融合

本文介绍了一种建立在大型语言模型基础之上，利用强化学习从任务反馈中提高模型任务解决能力的通用人工智能研究平台 OpenAGI，该平台旨在为测试和改进 AGI 的能力提供任务、数据集、评估指标和可扩展模型。

Apr, 2023

MindAgent：新兴游戏互动

我们提出了一种新型基础设施，名为 MindAgent，用于评估游戏交互中的规划和协调能力，并引入了新的游戏场景和相关基准，以评估多智能体协作效率。我们使用新的自动度量 CoS 进行全面评估。我们希望我们对大型语言语料库学习的 LLMs 以及用于通用调度和协调的新基础设施的发现能够揭示如何获取这些技能的一些见解。

Sep, 2023

基于 LLM 的多智能体强化学习：当前和未来方向

近年来，大型语言模型在问题回答、算术问题解决和诗歌创作等各种任务中展示了强大的能力。尽管关于以大型语言模型为代理的研究表明它可以应用于强化学习并取得不错的结果，但将基于大型语言模型的强化学习扩展到多智能体系统并不容易，因为许多方面，如智能体之间的协调和通信，在单智能体的强化学习框架中没有得到考虑。为了激发更多关于基于大型语言模型的多智能体强化学习的研究，本文调查了现有的基于大型语言模型的单智能体和多智能体强化学习框架，并提供了未来研究的潜在方向。特别关注多智能体共同目标合作任务和它们之间的通信，还考虑了语言组件在框架中实现的人机交互场景。

May, 2024