KnowAgent:基于 LLL 的智能 Agent 的知识增强规划
使用大型语言模型作为代理模型来执行交互式规划任务已取得令人称赞的结果。本文引入了参数化的世界知识模型(WKM)来促进代理规划,通过从专家和采样轨迹中自我合成知识,并提供全局任务知识和动态状态知识来指导全局规划和辅助局部规划。实验证明我们的方法在复杂的真实世界模拟数据集上相比强基线能够取得优越性能,减轻了盲目试错和幻觉行为问题,为代理对世界的理解提供了有力支持,同时表明了 WKM 具有更好的泛化性能、弱 WKM 能指导强代理模型的规划,并且统一的 WKM 训练具有进一步发展的潜力。
May, 2024
本文研究大型语言模型在互动环境中是否可以利用所学的世界知识来执行高层任务,并提出了一种条件方法,将语言模型生成的中级计划语义上翻译为合适的操作以提高执行性能。在 VirtualHome 环境中的实证评估结果表明,该方法在可执行性方面显著优于大型语言模型基线。
Jan, 2022
本研究旨在通过知识图谱改进大型语言模型 (LLM) 的推理能力,以回答复杂问题。我们提出了一种自主的基于 LLM 的智能体框架 KG-Agent,它允许一个小型 LLM 主动作出决策,直到完成对知识图谱的推理过程。在 KG-Agent 中,我们整合了 LLM、多功能工具箱、基于知识图谱的执行器和知识存储器,并开发了一个迭代机制,自主选择工具,然后更新用于对知识图谱进行推理的记忆。为了保证有效性,我们利用程序语言对知识图谱上的多跳推理过程进行了规范,并合成了基于代码的指令数据集,以对基础 LLM 进行微调。大量实验证明,仅使用 10K 个样本对 LLaMA-7B 进行微调就能在领域内外的数据集上超过使用更大的 LLM 或更多数据的现有方法。我们的代码和数据将公开发布。
Feb, 2024
本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师,以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning,同时提出通过物理接口增强 LLMs 的简单而有效的方法,实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。
Dec, 2022
我们引入了基于大型语言模型的信息获取代理系统 KwaiAgents,探索了其性能,并介绍了 Meta-Agent Tuning (MAT) 框架以确保在不同代理系统中优化的开源模型的表现。
Dec, 2023
这篇研究论文探索了大型语言模型在用户指令理解和决策方面的潜力,并提出了一种新的任务,即主动性代理规划。通过建立一个新的基准数据集和提出一个多代理框架,研究者验证了所提出框架的有效性。
Jun, 2024
将大型语言模型作为自主代理的规划模块,通过提供现有作品的分类和全面分析,讨论了任务分解、计划选择和外部模块等方向在 LLM-Agent 规划中的进展和挑战。
Feb, 2024
本文提出了 AdaPlanner,一种基于闭环反馈的语言模型智能体自适应地改进生成的计划,并通过新的技能发现机制,使其能够在更复杂的任务和环境中实现更好的连续决策性能,实验结果表明 AdaPlanner 在 ALFWorld 和 MiniWoB++ 环境中优于现有的基线算法。
May, 2023
利用 LLMs 在复杂的电脑游戏环境中赋予游戏智能体人类般的决策能力,以推进人工智能 (AGI) 的发展,并提供了 LLM 基础的游戏智能体的综述,包括感知、记忆、思考、角色扮演、行动和学习的六个关键组成部分,调研了六种游戏类型的现有代表性 LLM 基础游戏智能体,并展望了未来的研究和发展方向。
Apr, 2024
本文提出了一种整合环境对象和对象关系作为额外输入的方法,从而产生与场景中的对象相映射的行动计划,并设计了一种新的评分函数,该方法在 VirtualHome 模拟器和 ActivityPrograms 知识库中取得了可靠的结果,其行动计划的正确性和可执行性分别优于之前的研究约 5.3%和 8.9%。
Oct, 2022