AMOR: 通过过程反馈构建适应性模块化知识代理的方法

Feb, 2024

AMOR: 通过过程反馈构建适应性模块化知识代理的方法

AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback

Jian Guan, Wei Wu, Zujie Wen, Peng Xu, Hongning Wang...

TL;DR基于开源语言模型的 AMOR 代理框架通过外部知识库进行推理，并通过人类监督适应于具体领域的推理过程，利用有限状态机构建推理逻辑以实现问题解决和模块之间的过渡，并通过两阶段微调加强其泛化能力和适应性。通过多个领域的广泛实验，证明了基于有限状态机推理和过程反馈机制的 AMOR 相对于强基线的优势。

Abstract

The notable success of large language models (LLMs) has sparked an upsurge in building language agents to complete various complex tasks. We present amor, an agent framework based on open-source LLMs, which reaso

language models amor reasoning framework knowledge bases process feedback

发现论文，激发创造

模拟中的 LLM 实验：用于数字孪生中的过程仿真参数化的大型语言模型多主体系统

本文介绍了一种新颖的多智能体系统框架设计，利用大型语言模型（LLM）自动化数字孪生中的过程模拟参数化。我们提出了一个多智能体框架，包括观测、推理、决策和总结四种类型的智能体。通过启用 LLM 智能体与模拟模型之间的动态交互，该系统可以自动探索模拟的参数化，并使用启发式推理确定一组参数以控制模拟以实现目标。所提出的方法通过将 LLM 的启发式融入模拟模型，增强了模拟模型，并通过协助复杂的决策过程，增加了对用户的友好性并减轻了用户的认知负荷。通过案例研究证明了系统的有效性和功能，并在 GitHub 存储库中提供可视化演示。

May, 2024

利用 LLMs 实现内容为中心的认知代理的知识获取自动化

该论文介绍了一种利用大型语言模型技术支持智能代理语义词典中新条目的自动学习的系统。这种学习方法通过现有的非玩具词典和自然语言生成器引导启动，将意义的表达按基本本体建立转换为自然语言句子。此学习方法已应用于学习多词表达式，其含义与智能代理语义词典中的及物动词等效。实验展示了一种融合基于知识的方法、资源、传统数据分析和大型语言模型的混合学习架构的优势。

Dec, 2023

大型语言模型应通过行为模拟成为复杂人类系统的专家顾问

在本文中，我们探讨了大型语言模型（LLMs）在复杂人类系统中的推理能力，并提出了一种新的推理框架 ——“Mosaic Expert Observation Wall”（MEOW），利用生成型代理模拟技术。通过模拟数据训练一个专家模型，该模型在每个独立的模拟时间中专注于某个特定任务的 “经验”，通过模拟积累的 “经验” 使其成为复杂人类系统中某个任务的专家。我们在模拟真实世界安全场景的通信游戏中进行了实验，结果表明我们提出的方法可以与现有方法协同工作，增强大型语言模型在复杂人类系统中的推理能力。

Mar, 2024

Agent-OM：利用大型语言模型进行本体匹配

本文介绍了一种基于代理和大型语言模型的本体匹配系统设计范例，并通过实证评估证明其在简单、复杂和少样本本体匹配任务上的性能显著优于现有系统。

Dec, 2023

MAF: 提升大型语言模型的推理能力的多方面反馈

语言模型在自然语言任务中表现出令人印象深刻的性能，然而，在自然语言推理方面，语言模型仍面临幻觉、生成不正确的中间推理步骤和数学错误等挑战。最近的研究集中于通过自我改进和反馈来增强语言模型。然而，现有的方法依赖于单一的通用反馈来源，无法解决语言模型生成推理链中出现的多种错误类型。在这项工作中，我们提出了一种多方面反馈的迭代改进框架，该框架整合了多个反馈模块，包括冻结的语言模型和外部工具，每个模块都专注于特定的错误类别。我们的实验结果证明了我们的方法在解决语言模型生成的推理链中的几个错误，并因此提高了语言模型在多个推理任务中的整体性能。在数学推理中，我们看到了相对改进高达 20%，在逻辑推断中高达 18%。

Oct, 2023

AdaPlanner：使用语言模型的自适应反馈规划

本文提出了 AdaPlanner，一种基于闭环反馈的语言模型智能体自适应地改进生成的计划，并通过新的技能发现机制，使其能够在更复杂的任务和环境中实现更好的连续决策性能，实验结果表明 AdaPlanner 在 ALFWorld 和 MiniWoB++ 环境中优于现有的基线算法。

May, 2023

推荐 AI 代理：整合大型语言模型进行交互式推荐

通过将推荐模型和大型语言模型相结合，本文介绍了一个名为 RecAgent 的高效框架，旨在创建一个多功能和交互式的推荐系统，通过整合大型语言模型，将传统的推荐系统转化为具有自然语言界面的交互系统。实验结果表明，RecAgent 作为一个对话式推荐系统表现出令人满意的性能，优于通用的大型语言模型。

Aug, 2023

重构识别领域外数据的关系

利用大型语言模型作为中介代理在 Out-of-distribution 检测任务中引入了一个新方法，称为 Concept Matching with Agent（CMA），通过使用中立的提示作为代理以增强 CLIP-based OOD 检测的鲁棒性和适应性，实现了更好的 ID 和 OOD 输入的分离和识别。

May, 2024

多智能体混合增强大型语言模型能力

利用大型语言模型的集体优势，提出了一种基于多代理的混合方法，该方法在多个任务上取得了领先的性能，特别在 AlpacaEval 2.0 上实现了 65.1% 的得分，超过了 GPT-4 Omni 的 57.5%。

Jun, 2024

通过语言模型进行规划的具身推理

研究了大型语言模型在具身化场景下的规划能力，通过自然语言反馈的方式，提高对机器人控制场景的理解和指导完成任务的效果。

Jul, 2022