Jul, 2014

使用 SMOTE 方法进行预测软件构建结果的合成少数类过采样技术

TL;DR本研究运用数据流方法挖掘数据,构建决策树模型,通过软件构建过程中从源代码中获得的软件度量预测软件构建结果。使用 SMOTE 过采样算法合成新数据,并发现少量可用软件度量对预测构建结果具有重要意义。通过数据流处理,分类准确度可以持续提高至 80%,但由于数据在两个类别之间的分布而产生一些偏差。