多智能体混合增强大型语言模型能力

Jun, 2024

多智能体混合增强大型语言模型能力

Mixture-of-Agents Enhances Large Language Model Capabilities

Junlin Wang, Jue Wang, Ben Athiwaratkun, Ce Zhang, James Zou

TL;DR利用大型语言模型的集体优势，提出了一种基于多代理的混合方法，该方法在多个任务上取得了领先的性能，特别在 AlpacaEval 2.0 上实现了 65.1% 的得分，超过了 GPT-4 Omni 的 57.5%。

Abstract

Recent advances in large language models (LLMs) demonstrate substantial capabilities in natural language understanding and generation tasks. With the growing number of LLMs, how to harness the collective expertise

large language models mixture-of-agents collective expertise alpacaeval 2.0 state-of-art performance

发现论文，激发创造

大型多模态代理：综述

大型语言模型在多媒体领域的研究和发展方向的全面回顾，介绍了大型多媒体代理的开发要素和分类，评估方法的编制以及未来研究方向的提出。

Feb, 2024

多智能体协作：发挥智能 LLM 代理的力量

本文提出了一种通过多智能体系统来增强大型语言模型（LLMs）能力的新框架，并通过人工智能领域的案例研究展示了这一框架的实用性和多样性。

Jun, 2023

更多的代理是你所需要的

通过采样和投票方法，我们发现大型语言模型（LLMs）的性能与代理数量成比例。此方法与现有的复杂方法无关，其增强程度与任务难度相关。我们在广泛的 LLM 基准上进行了综合实验，验证了我们的发现，并研究了可以促进该发现的特性。

Feb, 2024

LLM 增强型自治代理能够合作吗？— 通过熔炉验证其合作能力

大语言模型在自主代理中的合作能力及其与 Melting Pot 环境中的应用和评估

Mar, 2024

基于大型语言模型的多智能体系统：进展与挑战综述

基于大型语言模型（LLM）的多智能体系统在复杂问题解决和世界模拟中取得了重大进展，我们提供了一份综述，深入讨论了基于 LLM 的多智能体系统的基本方面和挑战。

Jan, 2024

小型 LLM 是弱工具学习者：多 LLM 代理

我们提出了一个模块化的多语言模型框架，将大型语言模型能力分解为规划器、调用器和摘要生成器，并通过两阶段训练范式有效地训练该框架，该框架在各种工具使用基准测试中表现出超越传统单语言模型方法的效果，凸显了其在工具学习中的功效和优势。

Jan, 2024

智能代理链：大型语言模型在长文本任务上的协作

通过多个代理的协作，链式代理（CoA）框架能够处理长上下文任务，凭借信息聚合和上下文推理，有效提升任务质量。

Jun, 2024

专业代理 -- 将大型语言模型演变为具有人类级别能力的自主专家

大型语言模型的出现催生了自然语言处理的重大进展，通过引入专业代理框架（PAgents）利用 LLM 的能力创建具有可控、专业级、互动型专长的自主代理，我们认为通过持续发展的专业知识，PAgents 可以重塑专业服务。本文旨在激发关于 LLM 的有前景的现实应用的讨论，我们认为 PAgents 的日益复杂和集成可能会导致人工智能系统在复杂领域展示专业掌握能力，服务于重要需求，并潜在地实现人工通用智能。

Feb, 2024

Agent-OM：利用大型语言模型进行本体匹配

本文介绍了一种基于代理和大型语言模型的本体匹配系统设计范例，并通过实证评估证明其在简单、复杂和少样本本体匹配任务上的性能显著优于现有系统。

Dec, 2023

自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架

最近大型语言模型 (LLM) 代理实现的自动代码生成取得了重要进展，但现有的单代理方法面对生成和改进大规模复杂代码库的限制，该论文提出了自组织多代理框架 (SoA)，这是一种新的多代理框架，能够实现大规模代码的可扩展和高效生成优化。在 SoA 中，自组织代理独立操作以生成和修改代码组件，并无缝协作构建整体代码库，其关键特点是根据问题复杂度自动增加代理数量，从而实现动态可扩展性，使得代码量可以无限增加，而每个代理管理的代码量保持恒定。该论文在 HumanEval 基准上评估了 SoA，并证明与单一代理系统相比，SoA 中的每个代理处理的代码显著减少，但生成的整体代码量大幅增加。此外，SoA 在 Pass@1 准确率方面超过了强大的单代理基准 5%。

Apr, 2024