Mar, 2023

DACOS - 代码异味手动注释数据集

TL;DR本文介绍了使用机器学习技术来检测代码坏味道的 DACOS 数据集,该数据集包含了 10,267 个对 5,192 个代码片段的注释,并通过第一阶段确定指标的阈值和第二阶段收集注释来识别潜在主观的代码片段。同时,作者还开发了一个网络应用程序 TagMan,以帮助标注者浏览和标记代码片段并记录提供的注释。这个数据集可以帮助研究人员建立相关的、上下文感知的机器学习模型。