May, 2024

软件开发智能体的迭代经验优化

TL;DR在本文中,我们介绍了迭代式经验优化框架,使得大型语言模型(LLMs)驱动的自主代理能够在任务执行过程中迭代优化经验。我们提出了两种基本模式:连续模式,基于任务批次内最近的经验进行优化,和累积模式,跨越所有先前任务批次进行经验积累。我们的方法结合了启发式经验消除,有效管理经验空间并提高效率。广泛的实验表明,连续模式可能会产生更好的结果,而累积模式提供更稳定的性能。此外,经验消除助于仅使用高质量子集的11.54%实现更好的性能。