SwiftSage:一种具备快、慢思维能力的生成性代理,用于复杂交互任务
介绍了 SAGE(智能家居功能带有基于自主执行的代理)框架,以最大化智能家居助手的灵活性,通过使用基于 LLM 的自主代理系统取代手动定义的推理逻辑。SAGE 通过协调一系列工具整合用户偏好、设备状态和外部因素(如天气和电视时间表),具有从自然语言表达中学习用户偏好、通过阅读 API 文档与设备进行交互、编写代码持续监控设备以及理解自然设备引用等能力。为了评估 SAGE,我们开发了一个由 43 个具有挑战性的智能家居任务构成的基准,SAGE 成功完成了 23 个任务,显著优于现有的 LLM-enabled 基线(5/43)。
Nov, 2023
本文提出新的算法 SAGE,结合符号性规划与神经网络学习等方法,以克服传统模型的局限,更高效地解决基于模型的强化学习在处理部分了解环境时遇到的问题。该算法在出租车环境和 Minecraft 等变化场景中的表现优于其他方法。
Mar, 2022
基于语言指令,我们提出了 SAGE 框架,它能够通过语义解释和实际操作的部分之间的联系实现通用的关节物体操作,通过语言指令、视觉输入和互动反馈实现对关节物体的多样化操作。
Dec, 2023
我们引入了一种名为 AGILE 的 LLM 代理的新框架,旨在通过使用 LLMs、记忆、工具和专家的互动,执行与用户进行复杂对话的任务。我们将这样的 LLM 代理的构建形式化为一种强化学习问题,其中 LLM 作为策略模型。我们通过有标记的操作数据和 PPO 算法对 LLM 进行微调,并针对问答问题发布了一个名为 ProductQA 的代理数据集。我们对 ProductQA 和 MedMCQA 进行了广泛的实验,结果表明基于 13B 和 7B LLMs 的 PPO 训练的 AGILE 代理可以胜过 GPT-4 代理。我们的消融研究突出了记忆、工具、咨询、反思和强化学习在实现代理的强大性能方面的重要性。
May, 2024
SAGE 是一个用于自动建模和针对性问题生成解决方案的通用的面向问题的 Agent-based models 生成框架,它利用大型语言模型的跨领域知识进行在上下文学习过程中辅助验证,通过引导 LLMs 建模场景和提出假设性解决方案的目标表示,确保模型可执行性和解决方案的可行性。
Feb, 2024
Husky 是一个开放源代码的语言代理(language agent),通过在统一的行动空间上进行推理来解决涉及数值、表格和基于知识的复杂任务,它的实验结果显示在 14 个评估数据集上优于先前的语言代理,并且在混合工具推理方面甚至能与 GPT-4 等高级语言模型媲美。
Jun, 2024
通过将大语言模型与视觉信息相结合,建立了一种神经符号共同思考推理框架 JARVIS,用于构建可解释且高效的对话体载体,结果达到了现有方法中最优结果。
Aug, 2022
通过建立一个灵感来自 Thinking Fast and Slow 的认知理论的系统架构 SOFAI,该系统可以在不同情境下解决计划问题, 实现快速和慢思维,并且最终证明这种新的智能系统在问题的广泛性、解决时间和解决方案准确性等方面具有更好的表现。
Mar, 2023
本文提出了 Meta-SAGE,一种用于改善组合优化(CO)任务中深度强化学习模型的可伸缩性的新方法。 我们的方法通过建议两个组件:一个比例元学习器(SML)和指导探索的计划适应性(SAGE),将预训练模型适应到测试时间中的更大规模的问题,结果表明 Meta-SAGE 优于以前的适应方法,并且显着提高了具有代表性的 CO 任务的可伸缩性。
Jun, 2023
该研究提出了一种启发于双过程理论的图生成模型 ——FLOWGEN,其在生成大型图形时可根据难度实时切换快思维(较弱)或慢思维(强思维)模式,在保证性能的同时提升了处理速度。
Jul, 2022