Feb, 2024
基于神经网络的代码理解的重要性导向数据增强
Importance Guided Data Augmentation for Neural-Based Code Understanding
Zeming Dong, Qiang Hu, Xiaofei Xie, Maxime Cordy, Mike Papadakis...
TL;DR通过引入通用的数据增强框架 GenCode,该论文提出了一种用于增强代码理解模型训练的方法,通过代码转换技术生成新的代码候选项,并利用重要性度量选择重要的代码作为训练数据,实验证明 GenCode 相比 MixCode 增强方法,在平均准确率上提高了 2.92% 并且在鲁棒性方面提高了 4.90%。