SwiftSage：一种具备快、慢思维能力的生成性代理，用于复杂交互任务

May, 2023

SwiftSage：一种具备快、慢思维能力的生成性代理，用于复杂交互任务

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

Bill Yuchen Lin, Yicheng Fu, Karina Yang, Prithviraj Ammanabrolu, Faeze Brahman...

TL;DRSwiftSage 是一个受到人类认知双过程理论启发的新型代理框架，旨在通过行为克隆和提示大型语言模型的优势来提高任务完成性能，它在 30 项科学世界基准任务中显著优于其他方法。

Abstract

We introduce swiftsage, a novel agent framework inspired by the dual-process theory of human cognition, designed to excel in action planning for complex →

swiftsage agent framework interactive reasoning tasks behavior cloning large language models

发现论文，激发创造

SAGE：智能家居代理与实际执行

介绍了 SAGE（智能家居功能带有基于自主执行的代理）框架，以最大化智能家居助手的灵活性，通过使用基于 LLM 的自主代理系统取代手动定义的推理逻辑。SAGE 通过协调一系列工具整合用户偏好、设备状态和外部因素（如天气和电视时间表），具有从自然语言表达中学习用户偏好、通过阅读 API 文档与设备进行交互、编写代码持续监控设备以及理解自然设备引用等能力。为了评估 SAGE，我们开发了一个由 43 个具有挑战性的智能家居任务构成的基准，SAGE 成功完成了 23 个任务，显著优于现有的 LLM-enabled 基线（5/43）。

Nov, 2023

SAGE: 深度强化学习中为近视模型生成符号化目标

本文提出新的算法 SAGE，结合符号性规划与神经网络学习等方法，以克服传统模型的局限，更高效地解决基于模型的强化学习在处理部分了解环境时遇到的问题。该算法在出租车环境和 Minecraft 等变化场景中的表现优于其他方法。

Mar, 2022

SAGE: 在语言指令下桥接语义和可行动部分实现可推广的关节对象操作

基于语言指令，我们提出了 SAGE 框架，它能够通过语义解释和实际操作的部分之间的联系实现通用的关节物体操作，通过语言指令、视觉输入和互动反馈实现对关节物体的多样化操作。

Dec, 2023

AGILE: 一种新的 LLM 智能体框架

我们引入了一种名为 AGILE 的 LLM 代理的新框架，旨在通过使用 LLMs、记忆、工具和专家的互动，执行与用户进行复杂对话的任务。我们将这样的 LLM 代理的构建形式化为一种强化学习问题，其中 LLM 作为策略模型。我们通过有标记的操作数据和 PPO 算法对 LLM 进行微调，并针对问答问题发布了一个名为 ProductQA 的代理数据集。我们对 ProductQA 和 MedMCQA 进行了广泛的实验，结果表明基于 13B 和 7B LLMs 的 PPO 训练的 AGILE 代理可以胜过 GPT-4 代理。我们的消融研究突出了记忆、工具、咨询、反思和强化学习在实现代理的强大性能方面的重要性。

May, 2024

基于验证辅助的迭代情境学习的面向解决方案的代理模型生成

SAGE 是一个用于自动建模和针对性问题生成解决方案的通用的面向问题的 Agent-based models 生成框架，它利用大型语言模型的跨领域知识进行在上下文学习过程中辅助验证，通过引导 LLMs 建模场景和提出假设性解决方案的目标表示，确保模型可执行性和解决方案的可行性。

Feb, 2024

Husky 多步推理的统一开源语言代理

Husky 是一个开放源代码的语言代理（language agent），通过在统一的行动空间上进行推理来解决涉及数值、表格和基于知识的复杂任务，它的实验结果显示在 14 个评估数据集上优于先前的语言代理，并且在混合工具推理方面甚至能与 GPT-4 等高级语言模型媲美。

Jun, 2024

JARVIS: 一种面向对话体现代理的神经符号常识推理框架

通过将大语言模型与视觉信息相结合，建立了一种神经符号共同思考推理框架 JARVIS，用于构建可解释且高效的对话体载体，结果达到了现有方法中最优结果。

Aug, 2022

快速与缓慢规划

通过建立一个灵感来自 Thinking Fast and Slow 的认知理论的系统架构 SOFAI，该系统可以在不同情境下解决计划问题，实现快速和慢思维，并且最终证明这种新的智能系统在问题的广泛性、解决时间和解决方案准确性等方面具有更好的表现。

Mar, 2023

Meta-SAGE: 尺度元学习调度适应与引导勘探在组合优化中缓解尺度漂移

本文提出了 Meta-SAGE，一种用于改善组合优化（CO）任务中深度强化学习模型的可伸缩性的新方法。我们的方法通过建议两个组件：一个比例元学习器（SML）和指导探索的计划适应性（SAGE），将预训练模型适应到测试时间中的更大规模的问题，结果表明 Meta-SAGE 优于以前的适应方法，并且显着提高了具有代表性的 CO 任务的可伸缩性。

Jun, 2023

FLOWGEN：快速和慢速图生成

该研究提出了一种启发于双过程理论的图生成模型 ——FLOWGEN，其在生成大型图形时可根据难度实时切换快思维（较弱）或慢思维（强思维）模式，在保证性能的同时提升了处理速度。

Jul, 2022