一种受人类行为启发的程序理解神经网络架构
图神经网络为各领域的强大基于图的机器学习模型,但复杂的数据表示妨碍了对其预测解释的可理解性,从而减少了对其的信任和合作机会。该研究旨在为非技术领域专家提供可理解的图神经网络解释,并提出了一套以人为中心设计的解释要求,并通过两个示例原型来演示了其中一些建议的要求。
May, 2024
本文探讨了基于 NLP 预训练技术的代码表示学习的进展,提出了一种新的程序语义学习模式,即模型应该学习由与操作语义基本操作对齐的表示和不可或缺的环境转换信息构成的信息。为了验证我们的建议,我们提出了一个名为 OSCAR 的分层 Transformer 预训练模型,通过从 IR 和静态分析导出的编码表示中学习来表示基本操作和环境转换信息,证明了 OSCAR 在许多实际软件工程任务中理解程序语义的杰出能力。
May, 2021
本文提出了一种学习代码语义的新颖处理技术,并将其应用于各种程序分析任务中,其中使用的 Embeddings 基于独立于源编程语言的代码的 IR,现有技术不足以强烈理解程序语义。
Jun, 2018
本文在编程教育领域研究知识追踪,提出了一个新的模型 PDKT 以及一个最全面的数据集 BePKT,实验结果显示该模型在编程知识追踪方面表现突出,且码嵌入策略基于 PLCodeBERT 对于提高准确性有补充作用。
Dec, 2021
本文提出了一种基于多个线索的图神经网络(GNN)用于图像理解,相比于传统的特征和决策融合方法,GNN 能够在不同模型提取的特征之间传递信息。本文通过两个图像理解任务验证了 GNN 的性能,即组级情感识别(GER)和事件识别。实验表明,该方法在所选图像理解任务中取得了最优的性能。此外,本文介绍并共享了一个新的组级情感识别数据库。
Sep, 2019
通过代码语言模型生成三元组以构建语义结构明确的知识图谱,并使用增强理由生成法提高知识提取能力,实验结果表明该方法在基准数据集上取得优异表现。
Apr, 2023
本文介绍了一种新颖的 GNN 架构 ——IPAGNN,可以更好地学习使用控制流程图执行程序的任务,通过测试结果表明,其在系统性总结和部分程序执行的任务上比多种 RNN 和 GNN 基线模型表现更好。
Oct, 2020
本文提出了一种多视图图形编程表示方法,使用图形神经网络处理数据和控制流,并在此基础上评估了该方法在算法检测中的性能,结果表明这种方法比先前的方法表现得更好。
Feb, 2022
本篇论文提出利用图神经网络(Graph Neural Networks,GNNs)来学习通用源代码及其执行的融合表示的新方法,通过一个定义于低级表示的源代码和程序状态的多任务 GNN,成功地将复杂的源代码结构和复杂的数据结构转换为更简单,更一致的格式,引领 GNN 的新应用领域,其应用到具有挑战性的动态任务(SPEC CPU 基准套件中的分支预测和预抓取),超越现有技术水平 26%和 45%,并用于表现高性能的传输学习间接相关任务(算法分类)。
Jun, 2019