Apr, 2025

从大型语言模型推理到自主人工智能代理:综合评述

TL;DR本研究解决了当前大型语言模型和自主人工智能代理的评估基准缺乏统一分类和综合调查的问题。通过对2019年至2025年间开发的约60个基准进行并行比较,并提出相应的分类,文章展示了AI代理在多个领域中的实际应用和关键合作协议。研究的主要发现是,集成大型语言模型与模块化工具包能够推动自主决策和多步骤推理的效率,具有重要的现实应用潜力。