Sep, 2024

GPT-O1能消灭所有BUG吗?对GPT系列大型语言模型在QuixBugs上的评估

TL;DR本研究解决了不同版本GPT系列模型在自动程序修复(APR)中的有效性比较缺乏的问题。我们通过对最新的GPT模型版本进行评估,发现O1模型的修复能力超越了之前的版本,成功修复了基准中的所有40个BUG。这项工作为进一步探索GPT系列模型在APR中的应用奠定了基础。