Feb, 2024

基于神经网络的代码理解的重要性导向数据增强

TL;DR通过引入通用的数据增强框架 GenCode,该论文提出了一种用于增强代码理解模型训练的方法,通过代码转换技术生成新的代码候选项,并利用重要性度量选择重要的代码作为训练数据,实验证明 GenCode 相比 MixCode 增强方法,在平均准确率上提高了 2.92% 并且在鲁棒性方面提高了 4.90%。