软件开发代理的体验式合作学习
我们介绍了一种名为 ExpeL 的经验学习代理,它可以自主地收集经验并从训练任务的语料库中提取知识,通过回想其提取的洞察和过去的经验做出明智的决策,我们的实证结果突出了 ExpeL 代理的强大学习效果,并展示了其在性能上的持续增强以及迁移学习潜力。
Aug, 2023
在本文中,我们介绍了迭代式经验优化框架,使得大型语言模型(LLMs)驱动的自主代理能够在任务执行过程中迭代优化经验。我们提出了两种基本模式:连续模式,基于任务批次内最近的经验进行优化,和累积模式,跨越所有先前任务批次进行经验积累。我们的方法结合了启发式经验消除,有效管理经验空间并提高效率。广泛的实验表明,连续模式可能会产生更好的结果,而累积模式提供更稳定的性能。此外,经验消除助于仅使用高质量子集的 11.54% 实现更好的性能。
May, 2024
通过大型语言模型开发一种名为 AgentsCoDriver 的框架,实现多车辆协同驾驶,解决了当前的自主驾驶系统在解释性、泛化性、持续学习以及与其他车辆的协商与合作方面的不足。
Apr, 2024
该论文介绍了一种利用大型语言模型技术支持智能代理语义词典中新条目的自动学习的系统。这种学习方法通过现有的非玩具词典和自然语言生成器引导启动,将意义的表达按基本本体建立转换为自然语言句子。此学习方法已应用于学习多词表达式,其含义与智能代理语义词典中的及物动词等效。实验展示了一种融合基于知识的方法、资源、传统数据分析和大型语言模型的混合学习架构的优势。
Dec, 2023
利用工具学习来增强大型语言模型作为代理人使用外部工具来扩展其能力。我们提出了合作互动的代理人(ConAgents)框架,将工具学习的工作流程模块化为基础,执行和观察代理人,并引入迭代校准(IterCali)方法,以适应工具环境的反馈。实验证明我们的 ConAgents 框架在三个数据集上优于 SOTA 基准,同时我们还提供了对框架的效率和一致性的细粒度分析。
Mar, 2024
该研究提出了一种新的生成代理框架 EduAgent,结合认知先验知识来引导大型语言模型首先推理各种行为之间的相关性,然后进行模拟,实现对真实学生和虚拟学生学习行为的模仿、预测和生成。
Mar, 2024
我们的研究探索了语言代理程序的开放式行为学习,在每一次迭代中,通过修正和更新当前可用的动作,从而提高动作的有效性,实验证明,这种开放式行为学习方法显著改善了代理程序的性能,突出了经验行为学习在更智能的大型语言模型代理程序发展中的重要性。
Feb, 2024
应用大型语言模型(LLMs)在各种任务和社会模拟中取得了显著进展,但它们在任务导向的社会背景中的协调能力尚未得到充分探索。为了弥合这一差距,我们引入了协作生成代理,为基于 LLMs 的代理赋予一致的行为模式和解决任务的能力。我们将这些代理置于一个模拟的招聘会环境中进行案例研究,以审查它们的协调能力。我们提出了一个新颖的框架,赋予协作生成代理人类般的推理能力和专业技能。我们的评估结果表明,这些代理显示出有希望的性能。然而,我们也发现了限制,阻碍了它们在更复杂的协调任务中的效果。我们的工作对于 LLMs 在任务导向的社会模拟中的作用和发展提供了有价值的见解。
Oct, 2023