Oct, 2022

MIXCODE: 基于 Mixup 的数据增强技术提升代码分类性能

TL;DR本文提出了一种名为 MIXCODE 的数据增强方法,通过使用多个代码重构方法生成变换的代码,并使用 Mixup 技术将原始代码与变换后的代码混合以增加训练数据,从而在代码分类和缺陷检测等代码任务中有效地补充有效的训练数据,并使性能提高了 6.24%的准确度和 26.06%的健壮性。