一种受人类行为启发的程序理解神经网络架构

May, 2022

一种受人类行为启发的程序理解神经网络架构

A Neural Network Architecture for Program Understanding Inspired by Human Behaviors

Renyu Zhu, Lei Yuan, Xiang Li, Ming Gao, Wenyuan Cai

TL;DR本文提出了一个 PGNN-EK 模型，该模型由两个主要组成部分组成，以人类行为为参考，分别使用基于 AST 的基于分区的图神经网络模型和外部知识的信息提取进行预训练，以输出代码嵌入，并通过广泛的实验表明本模型在代码概述和代码克隆检测任务方面的卓越性能。

Abstract

program understanding is a fundamental task in program language processing. Despite the success, existing works fail to take human behaviors as reference in understanding programs. In this paper, we consider

program understanding human behaviors pgnn-ek model graph neural network code summarization

发现论文，激发创造

人类中心的图神经网络解释的设计要求

图神经网络为各领域的强大基于图的机器学习模型，但复杂的数据表示妨碍了对其预测解释的可理解性，从而减少了对其的信任和合作机会。该研究旨在为非技术领域专家提供可理解的图神经网络解释，并提出了一套以人为中心设计的解释要求，并通过两个示例原型来演示了其中一些建议的要求。

May, 2024

使用图神经网络实现程序终止

本文提出一种使用图卷积神经网络和图注意力网络进行程序终止性分析的方法，并结合语义分割定位 AST 节点进行非终止原因的估计和调试。

Jul, 2022

神经网络如何理解程序？

本文探讨了基于 NLP 预训练技术的代码表示学习的进展，提出了一种新的程序语义学习模式，即模型应该学习由与操作语义基本操作对齐的表示和不可或缺的环境转换信息构成的信息。为了验证我们的建议，我们提出了一个名为 OSCAR 的分层 Transformer 预训练模型，通过从 IR 和静态分析导出的编码表示中学习来表示基本操作和环境转换信息，证明了 OSCAR 在许多实际软件工程任务中理解程序语义的杰出能力。

May, 2021

神经代码理解：可学习的代码语义表示

本文提出了一种学习代码语义的新颖处理技术，并将其应用于各种程序分析任务中，其中使用的 Embeddings 基于独立于源编程语言的代码的 IR，现有技术不足以强烈理解程序语义。

Jun, 2018

编程知识跟踪：一份全面数据集和一个新模型

本文在编程教育领域研究知识追踪，提出了一个新的模型 PDKT 以及一个最全面的数据集 BePKT，实验结果显示该模型在编程知识追踪方面表现突出，且码嵌入策略基于 PLCodeBERT 对于提高准确性有补充作用。

Dec, 2021

基于多个线索的图神经网络用于图像理解：以群体情绪识别和事件识别为例

本文提出了一种基于多个线索的图神经网络（GNN）用于图像理解，相比于传统的特征和决策融合方法，GNN 能够在不同模型提取的特征之间传递信息。本文通过两个图像理解任务验证了 GNN 的性能，即组级情感识别（GER）和事件识别。实验表明，该方法在所选图像理解任务中取得了最优的性能。此外，本文介绍并共享了一个新的组级情感识别数据库。

Sep, 2019

CodeKGC: 基于代码的生成式知识图谱构建模型

通过代码语言模型生成三元组以构建语义结构明确的知识图谱，并使用增强理由生成法提高知识提取能力，实验结果表明该方法在基准数据集上取得优异表现。

Apr, 2023

使用指针注意图神经网络学习执行程序

本文介绍了一种新颖的 GNN 架构 ——IPAGNN，可以更好地学习使用控制流程图执行程序的任务，通过测试结果表明，其在系统性总结和部分程序执行的任务上比多种 RNN 和 GNN 基线模型表现更好。

Oct, 2020

编程语言处理的多视角图形表示：算法检测研究

本文提出了一种多视图图形编程表示方法，使用图形神经网络处理数据和控制流，并在此基础上评估了该方法在算法检测中的性能，结果表明这种方法比先前的方法表现得更好。

Feb, 2022

通过神经代码融合学习执行

本篇论文提出利用图神经网络（Graph Neural Networks，GNNs）来学习通用源代码及其执行的融合表示的新方法，通过一个定义于低级表示的源代码和程序状态的多任务 GNN，成功地将复杂的源代码结构和复杂的数据结构转换为更简单，更一致的格式，引领 GNN 的新应用领域，其应用到具有挑战性的动态任务（SPEC CPU 基准套件中的分支预测和预抓取），超越现有技术水平 26％和 45％，并用于表现高性能的传输学习间接相关任务（算法分类）。

Jun, 2019