AutoFlow:大型语言模型代理自动生成工作流
通过对基于大语言模型的自主代理的综合调查,本文提出了一个统一框架来概括以往研究,并总结了在社会科学、自然科学和工程领域中应用大语言模型的人工智能代理的各种应用及评估策略。同时,我们还讨论了该领域的挑战和未来方向。
Aug, 2023
通过动态生成并协调多个专门的代理来构建AI团队,AutoAgents框架为不同任务自适应地生成和协调多个专门的代理,结果表明它比现有的多代理方法产生更连贯和准确的解决方案,为解决复杂任务提供了新的视角。
Sep, 2023
该篇论文提出了一种名为``Formal-LLM''的新型框架用于基于LLM的代理,通过结合自然语言的表现力和形式语言的准确性,使规划过程具有控制性,从而防止代理生成无效和不成功的计划,并且通过实验验证了该框架在任务性能上取得的超过50%的整体性能提升,为在规划的有效性至关重要的应用场景中更广泛地利用LLM提供了可能性。
Feb, 2024
基于大型语言模型(LLM)的多智能体系统在复杂问题解决和世界模拟中取得了重大进展,我们提供了一份综述,深入讨论了基于LLM的多智能体系统的基本方面和挑战。
Jan, 2024
Robotic Process Automation (RPA)的快速发展在自动化重复任务方面取得了显著进展,然而在用户要求进行即兴或不可预测任务的场景下,其效果减弱。本文介绍了一种新的方法FlowMind,利用大型语言模型(LLMs)如Generative Pretrained Transformer(GPT),以解决这一限制并创建一个自动工作流生成系统。FlowMind通过提供高层次的自动生成工作流描述简化用户交互,并能够有效地检查和提供反馈。我们还介绍了NCEN-QA,这是一个用于基准化基金的N-CEN报告的问题回答任务的金融数据集。我们使用NCEN-QA来评估由FlowMind生成的工作流与FlowMind的基准和消融变体的性能。我们展示了FlowMind的成功,论证了提出的讲座方法中每个组件的重要性以及FlowMind中用户交互和反馈的有效性。
Mar, 2024
最近关于大型语言模型(LLMs)的研究推动了复杂主动工作流的发展,取得了优于传统单途径思维链(CoT)提示技术的进展。本文调查总结了常见的工作流程,特别关注LLM-Profiled Components(LMPCs)并忽略非LLM组件,旨在帮助更清晰地理解LLM的作用,并研究LMPCs的可重用性。
Jun, 2024
本研究解决了大规模语言模型(LLMs)在执行AI代理工作流程中的逻辑推理不足问题。通过引入预训练模型的联盟,每个模型在独立子任务中表现出色,展示了这种方法在增强模型鲁棒性和降低操作成本方面的潜力。研究结果表明,考虑预训练模型的联盟可减少对专门微调的需要,且该方法可扩展至其他使用LLMs的非代理系统。
Aug, 2024
本研究解决了传统人工智能模型的局限性,探索了通过工作流程集成模型、数据源和管道,以实现更复杂和多样化任务的协同AI系统。GenAgent框架创新性地以代码形式表示工作流程,并通过协同代理逐步构建,实验证明其在效果和稳定性上优于基线方法,展现了更高的灵活性和可扩展性。
Sep, 2024
本研究针对大型语言模型(LLMs)在软件工程领域的应用现状进行综述,通过整合外部资源和工具,大幅提升了LLM的能力。研究表明,基于LLM的代理可以有效应对复杂的现实软件工程问题,并为未来的研究方向提供了新的思路。
Sep, 2024