BriefGPT.xyz
Ask
alpha
关键词
swe-bench
搜索结果 - 2
代码 R:多智能体和任务图的问题解决
采用多智能体框架和预定义的任务图,提出了 CodeR,用于修复和解决代码存储库中报告的错误和添加新功能。在 SWE-bench lite 中,CodeR 能够解决 28.00%的问题,每个问题仅需提交一次。检验了 CodeR 的每个设计对性
→
PDF
a month ago
SWE-bench:能否通过语言模型解决真实世界的 GitHub 问题?
评估了新一代语言模型在软件工程领域的能力,通过 SWE-bench 框架提供了包括软件工程问题和对应 Python 库的真实 GitHub 问题的解决方案,结果表明目前的模型在解决问题时仍存在困难,呼吁进一步提高模型在实际应用中的智能和自主
→
PDF
9 months ago
Prev
Next