Nov, 2023

语言模型是否学习了代码的语义?漏洞检测案例研究

TL;DR通过解释性工具、关注分析和交互矩阵分析,我们发现预训练语言模型对于潜在脆弱语句的关联性表现更好,但其对于脆弱路径的关联性较弱甚至没有,基于我们的分析,我们开发了两种突出模型输入中含有错误语义的注释方法,实验结果显示与传统微调相比,在大多数情况下我们的注释方法能够提高模型性能,并使模型与潜在脆弱语句的关联性提高高达 232%,这表明提供模型有关错误语义的信息是有帮助的并且激发了后续针对学习更复杂基于路径的错误语义的研究。