软件工程中的智能体:调查、现状与展望
通过对基于大语言模型的自主代理的综合调查,本文提出了一个统一框架来概括以往研究,并总结了在社会科学、自然科学和工程领域中应用大语言模型的人工智能代理的各种应用及评估策略。同时,我们还讨论了该领域的挑战和未来方向。
Aug, 2023
人工智能代理是一个前景光明的领域,利用大型语言模型作为基础构建通用人工智能代理带来了显著的进展,其在单一代理场景、多代理场景以及人机合作中的广泛应用展示了卓越的潜力,并为人类社会提供了有价值的见解。
Sep, 2023
本文研究了大型语言模型(LLM)与传统人工智能代理之间的核心区别和特征,着重比较了两种代理的基本特征,并阐明了LLM代理在处理自然语言、知识存储和推理能力方面的显著优势。随后,对AI代理的核心组成部分进行了深入分析,包括规划、记忆和工具使用。尤其对于关键的记忆组件,本文引入了创新的分类方案,不仅摆脱了传统的分类方法,还为AI代理的记忆系统设计提供了新的视角。我们坚信对这些核心组件的深入研究和理解将为AI代理技术的未来发展奠定坚实的基础。在文章结尾,我们提供了进一步研究的指导性建议,希望能为该领域的学者和研究人员提供有价值的见解。
Sep, 2023
对基于大型语言模型(LLM)的智能代理进行了深入调查,涵盖了单代理和多代理系统中的定义、研究框架、组成、认知和规划方法、工具利用、对环境反馈的响应,以及在多代理系统中部署LLM-based代理的机制,包括多角色协作、信息传递和缓解代理之间通信问题的策略,同时介绍了流行的数据集和应用场景,最后展望了基于LLM的代理在人工智能和自然语言处理领域的前景。
Jan, 2024
基于大型语言模型(LLM)的多智能体系统在复杂问题解决和世界模拟中取得了重大进展,我们提供了一份综述,深入讨论了基于LLM的多智能体系统的基本方面和挑战。
Jan, 2024
将大型语言模型作为自主代理的规划模块,通过提供现有作品的分类和全面分析,讨论了任务分解、计划选择和外部模块等方向在LLM-Agent规划中的进展和挑战。
Feb, 2024
大型语言模型 (LLM) 在特定领域的软件(如浏览器和游戏)中赋予智能代理执行复杂任务的能力。然而,应用于操作系统等通用软件系统时,LLM代理面临三个主要挑战:广泛且动态的操作空间,跨应用程序的合作需求以及符合用户约束条件的最优解。本研究设计了环境和基准测试工具 AndroidArena,通过可扩展的、半自动化的方法构建了该基准。研究结果发现,即使是最先进的LLM代理在跨应用程序情景和遵守特定约束方面也存在困难。此外,通过对反思能力的失败进行实证分析,提出的探索策略将成功率提高了27%。该工作首次揭示了LLM代理的细粒度弱点,并为未来研究提供了方向。AndroidArena的环境、基准以及评估代码已在链接中公开发布。
Feb, 2024
大型语言模型(LLM)基于代理近年来引起了研究和行业界的广泛关注。本文提出了对LLM基于代理的记忆机制进行全面调查,包括记忆的定义、需要、设计、评估以及在代理应用中的重要作用,并分析了现有工作的局限性和未来方向。
Apr, 2024
本研究解决了大型语言模型(LLMs)与基于LLMs的代理之间的区别不明确的问题。通过对软件工程中LLMs和LLM-based代理的应用进行广泛调查,论文总结了六个关键主题,并对它们的效果和应用进行了全面分析。研究结果为推动软件工程中基于LLMs的代理的未来研究提供了重要思路。
Aug, 2024
本研究针对大型语言模型(LLMs)在软件工程领域的应用现状进行综述,通过整合外部资源和工具,大幅提升了LLM的能力。研究表明,基于LLM的代理可以有效应对复杂的现实软件工程问题,并为未来的研究方向提供了新的思路。
Sep, 2024