Apr, 2020

使用 code2vec 进行 Java 类的嵌入:来自变量混淆的改进

TL;DR本论文研究使用机器学习进行源码分析的问题,提出解决标准机器学习方法不能直接用于源代码的问题。作者通过使用 code2vec 嵌入方法来解决问题,但是实验结果表明,变量名对预测结果有较大影响。因此,作者提出了对变量名进行混淆的方法,进一步提高了嵌入模型的准确性,并探索了一种方法将类别层面的信息整合到嵌入模型中。研究结果在源代码分类方面表现出了较好的性能。