May, 2019

单语句 Bug 有多常见? ManySStuBs4J 数据集

TL;DR提供了一个数据集,包含来自 1,000 个流行开源 Java 项目中挖掘的 153,652 个单语句代码修复,注释了它们是否与 16 个由先进程序修复技术启发的 Bug 模板之一相匹配,结果显示简单的 Bug 修复模板匹配率约为 33%,且模板配对 Bug 在最新版本的项目中每 1,600-2,500 行代码出现频率约为一个 Bug。希望该数据集对程序修复和实证软件工程研究都能有所帮助。