Apr, 2023

从自然语言问题描述生成功能正确的代码编辑

TL;DR本文提出了将自然语言编程描述翻译为正确代码修改的任务 NL2Fix,为此引入了包含高级 Bug 修复描述的 Defects4J-NL2Fix 数据集,并对多种最先进的 LLMs 进行了实证评估,结果表明这些 LLMs 能够对 64.6% 的错误生成合理的修复,并且最佳 LLM 技术在此基准测试中可以达到 21.20% 的 top-1 和 35.68% 的 top-5 精度。