大规模语言模型的联盟增强AI代理的鲁棒性
通过对基于大语言模型的自主代理的综合调查,本文提出了一个统一框架来概括以往研究,并总结了在社会科学、自然科学和工程领域中应用大语言模型的人工智能代理的各种应用及评估策略。同时,我们还讨论了该领域的挑战和未来方向。
Aug, 2023
人工智能代理是一个前景光明的领域,利用大型语言模型作为基础构建通用人工智能代理带来了显著的进展,其在单一代理场景、多代理场景以及人机合作中的广泛应用展示了卓越的潜力,并为人类社会提供了有价值的见解。
Sep, 2023
本文研究了大型语言模型(LLM)与传统人工智能代理之间的核心区别和特征,着重比较了两种代理的基本特征,并阐明了LLM代理在处理自然语言、知识存储和推理能力方面的显著优势。随后,对AI代理的核心组成部分进行了深入分析,包括规划、记忆和工具使用。尤其对于关键的记忆组件,本文引入了创新的分类方案,不仅摆脱了传统的分类方法,还为AI代理的记忆系统设计提供了新的视角。我们坚信对这些核心组件的深入研究和理解将为AI代理技术的未来发展奠定坚实的基础。在文章结尾,我们提供了进一步研究的指导性建议,希望能为该领域的学者和研究人员提供有价值的见解。
Sep, 2023
该研究介绍了使用大型语言模型在多智能体协调方面的有效性评估,构建了LLM-Co框架来使LLMs能够进行协调游戏,并展示了LLMs在不同方面的评估结果,从而强调了LLMs在复杂协调环境中的潜力。
Oct, 2023
对基于大型语言模型(LLM)的智能代理进行了深入调查,涵盖了单代理和多代理系统中的定义、研究框架、组成、认知和规划方法、工具利用、对环境反馈的响应,以及在多代理系统中部署LLM-based代理的机制,包括多角色协作、信息传递和缓解代理之间通信问题的策略,同时介绍了流行的数据集和应用场景,最后展望了基于LLM的代理在人工智能和自然语言处理领域的前景。
Jan, 2024
基于大型语言模型(LLM)的多智能体系统在复杂问题解决和世界模拟中取得了重大进展,我们提供了一份综述,深入讨论了基于LLM的多智能体系统的基本方面和挑战。
Jan, 2024
近期大型语言模型(LLM)在实现具备人类级智能的自主代理方面显示出了潜力,然而现有用于评估LLM代理的基准要么使用静态数据集,可能导致数据泄露,要么仅关注单一代理情景,忽略多代理交互的复杂性。我们引入了LLMArena,这是一个新颖且易于扩展的框架,用于评估LLM在多代理动态环境中的各种能力。LLMArena涵盖了七个不同的游戏环境,使用Trueskill评分来评估LLM代理的关键能力,包括空间推理、战略规划、数值推理、风险评估、沟通、对手建模和团队协作。通过对不同规模和类型的LLM进行广泛实验和人类评估,研究表明LLM在对手建模和团队协作方面仍有很长的发展道路,希望LLMArena能指导未来的研究,进一步增强LLM的这些能力,最终实现在动态多代理环境中更复杂和实用的应用。代码和数据将提供。
Feb, 2024
通过构建特定于代理的数据和有监督微调模型,以及设计有效激活大型语言模型推理能力的提示方法,我们提出了一种综合的方法来提高大型语言模型作为代理的性能,并通过在AgentBench的五个代理任务上的评估取得了令人满意的结果。
Mar, 2024
通过将大型语言模型(LLMs)组织成以社区为基础的结构,该论文介绍了一种变革性方法,旨在增强LLMs的集体智能和问题解决能力。本文研究了不同的组织模型 - 分层、扁平、动态和联邦,每种模型都具有协作人工智能系统的独特优势和挑战。在这些结构化社区中,LLMs被设计为专门从事不同的认知任务,采用直接通信、投票系统和基于市场的方法等先进的交互机制,并动态调整其治理结构以满足不断变化的需求。这种社区的实施对于提高人工智能的问题解决能力具有重大潜力,因此有必要深入研究其伦理考虑、管理策略和可扩展性。本文旨在为未来研究奠定基础,主张在人工智能研究和应用中从孤立到协同的运行框架进行范式转变。
May, 2024