基础代理：决策制定的范式转变

ICMLMay, 2024

Position: Foundation Agents as the Paradigm Shift for Decision Making

Xiaoqian Liu, Xingzhou Lou, Jianbin Jiao, Junge Zhang

TL;DR决策制定需要通过知觉、记忆和推理之间的复杂相互作用来识别最优策略。本文提出基于基础代理的构建作为学习代理的一种变革性转变，旨在解决决策制定中面临的低样本效率和泛化能力差的挑战。通过从大型语言模型（LLMs）获得启示，明确了基础代理的基本特征和面临的挑战，以及从大规模的交互式数据收集或生成到自监督预训练和自适应，再到与 LLMs 的知识和价值对齐的基础代理的路线图。最后，指出了从提出的构想中得出的关键研究问题，并勾勒了基于真实世界用例支持的基础代理的趋势，旨在解决技术和理论方面的问题，推动该领域朝着更全面和有影响力的未来发展。

Abstract

decision making demands intricate interplay between perception, memory, and reasoning to discern optimal policies. Conventional approaches to decision making face challenges related to low sample efficiency and poor generalization. In contrast, foundation models in language and vision

decision making foundation agents learning paradigm large language models research questions

发现论文，激发创造

决策基础模型：问题、方法与机遇

本文检查了基于决策制定的基础模型的范围，并提供了理解问题空间和探索新研究方向的概念工具和技术背景。通过各种方法，例如提示、条件生成建模、规划、最优控制和强化学习，审查了将基础模型用于实际决策制定应用的最近方法，并讨论了该领域的常见挑战和开放问题。

Mar, 2023

基础模型向导：通过知识和推理指引基础模型

基于对代理与基础模型互动模式的分类和对该模式的扩展架构提出的综述性论文，为实现基础模型在实际人工智能系统中的潜力提供了指导。

Feb, 2024

交互式代理基础模型

提出了一种交互式代理基础模型，采用新颖的多任务代理训练范式，实现了跨领域、数据集和任务训练 AI 代理的能力，展示了其在机器人技术、游戏 AI 和医疗保健领域的性能，支持多模态和多任务学习。

Feb, 2024

自动驾驶中的基础模型调查

该研究综述介绍了基础模型在自动驾驶中的应用，探讨了其在规划、仿真、三维物体检测以及多模态模型方面的作用，并提供了基于模态和功能对基础模型的分类，同时指出了现有模型与创新自动驾驶方法之间的差距，并提出了填补这些差距的未来研究方向和路线图。

Feb, 2024

基于 Foundation Model 的系统设计框架

本研究提出了一个基于基础模型的系统分类法，涉及预训练和微调，基于基础模型的系统的体系结构设计以及负责任的 AI-by-design。该分类法为基于基础模型的系统设计提供了具体的指南，并突出了设计决策带来的权衡。

May, 2023

基础模型的机遇与风险

AI 基础模型的兴起，具有广泛数据训练和可适应下游任务的特点，其机制、应用和社会影响需要更多的跨学科合作来研究。

Aug, 2021

走向基础模型统一的智能体

通过在强化学习代理中嵌入和利用语言模型和视觉语言模型的能力，我们设计了一个框架，将语言作为核心推理工具，能够处理一系列强化学习挑战，如有效的探索、重用经验数据、调度技能以及从观察中学习，从而改进了在模拟的机器人操作环境中的性能，并展示了如何利用学到的技能解决新任务或模仿人类专家视频。

Jul, 2023

基础模型简介：历史、社会和技术焦点

本文介绍了基础模型，深度学习中通过模型大小和训练数据广度和大小的扩展可以对未来的 AI 开发造成破坏。基础模型在各种任务领域（如自然语言处理和计算机视觉）中实现了最先进的性能，并且通过进一步的改进常常得到更好的表现。此外，模型的单一化可能会将众多特定任务的模型替换为由少数公司控制的更少数量的大型模型，从而导致对 AI 的权力和控制的转移，并出现新兴的行为方式：上下文学习。

Dec, 2022

基模型推理综述

发展基础模型的探索性研究目前取得了最新的进展，其涉及推理任务、多模态学习和自主智能代理等未来研究方向，为人工智能的发展做出了贡献。

Dec, 2023

教育的基础模型：承诺与前景

领域模型在教育中的应用以及个性化学习、教育不平等、推理能力和适应性学习环境等方面的优势，结合面向教育的代理体系结构的发展，旨在创造动态、包容和适应性强的教育生态系统。同时强调了过度依赖人工智能和创意风险与机会，并展望了一个将人工智能与人类能力和谐结合的未来。

Apr, 2024