May, 2024

SWE-agent: 代理 - 计算机接口实现自动化软件工程

TL;DR介绍了一种名为 SWE-agent 的自主系统,它使用一种语言模型与计算机进行交互解决软件工程任务。通过自定义的 agent-computer interface (ACI) 界面,SWE-agent 能够增强代理程序创建和编辑代码文件、浏览整个代码库和执行程序的能力。在 SWE-bench 上,与检索增强生成 (retrieval-augmented generation, RAG) 技术达到的 3.8% 相比,SWE-agent 能够解决 12.5% 的问题。研究还探讨了 ACI 设计对代理程序行为和性能的影响,并提供了有效设计的建议。