ICMLMay, 2024

基础代理:决策制定的范式转变

TL;DR决策制定需要通过知觉、记忆和推理之间的复杂相互作用来识别最优策略。本文提出基于基础代理的构建作为学习代理的一种变革性转变,旨在解决决策制定中面临的低样本效率和泛化能力差的挑战。通过从大型语言模型(LLMs)获得启示,明确了基础代理的基本特征和面临的挑战,以及从大规模的交互式数据收集或生成到自监督预训练和自适应,再到与 LLMs 的知识和价值对齐的基础代理的路线图。最后,指出了从提出的构想中得出的关键研究问题,并勾勒了基于真实世界用例支持的基础代理的趋势,旨在解决技术和理论方面的问题,推动该领域朝着更全面和有影响力的未来发展。