Mar, 2023

代码概括模型学习所得的解析

TL;DR本文首次给出了代码概括模型所发现的模式的形式化定义,并提出了一种推断正则语言文法的声学算法。 PATIC 对代码 2vec 和代码 2seq 进行了评估并发现提取出的模式受限于局部和语法代码结构并缺乏语义含义。基于这些发现,本文介绍了正式定义模式的两个新方法:评估健壮性和提高代码概括模型的准确性。