动态神经程序嵌入用于程序修复

Nov, 2017

Dynamic Neural Program Embedding for Program Repair

Ke Wang, Rishabh Singh, Zhendong Su

TL;DR提出了一种基于程序执行轨迹学习的新型语义程序嵌入，相比于基于程序语法的嵌入，可以更准确地捕捉程序语义，并用于预测学生程序提交中的错误类型，并展示了通过该语义嵌入预测进行搜索的效率显著提高的结果。

Abstract

neural program embeddings have shown much promise recently for a variety of program analysis tasks, including program synthesis,

neural program embeddings semantic program embedding program analysis program synthesis program repair

发现论文，激发创造

神经代码理解：可学习的代码语义表示

本文提出了一种学习代码语义的新颖处理技术，并将其应用于各种程序分析任务中，其中使用的 Embeddings 基于独立于源编程语言的代码的 IR，现有技术不足以强烈理解程序语义。

Jun, 2018

代码向量：通过嵌入式的抽象符号化痕迹理解程序

本文介绍了如何使用程序追踪的抽象作为表示学习单词嵌入的一种方法，并展示了使用主要基于语义抽象的学习嵌入提供了接近三倍的准确度。

Mar, 2018

关于循环神经网络变量嵌入在源代码中的研究

本研究提出了动态嵌入，这是一种递归机制，能够依据变量在程序中的角色来调整学习到的语义，该方法在代码自动补全和错误修复任务中，显著提高了循环神经网络的性能。

Oct, 2020

神经网络如何理解程序？

本文探讨了基于 NLP 预训练技术的代码表示学习的进展，提出了一种新的程序语义学习模式，即模型应该学习由与操作语义基本操作对齐的表示和不可或缺的环境转换信息构成的信息。为了验证我们的建议，我们提出了一个名为 OSCAR 的分层 Transformer 预训练模型，通过从 IR 和静态分析导出的编码表示中学习来表示基本操作和环境转换信息，证明了 OSCAR 在许多实际软件工程任务中理解程序语义的杰出能力。

May, 2021

利用神经符号转换网络进行语义化代码修复

通过使用语义修复的统计模型和神经网络，我们的研究成功地预测代码中的错误位置，并将其修复，从而提高了修复的准确性。

Oct, 2017

关于神经程序模型对语义保持程序转换的普适性

本文通过对三个 Java 数据集和三种最先进的神经网络代码的比较，来评估神经程序模型在语义保持转换下的一般性，并发现神经程序模型在语法和外部形象不同但语义相同的程序上表现不佳。

Jul, 2020

学习程序嵌入以传递学生代码反馈

本文利用神经网络将程序编码成一个从预置条件空间到后置条件空间的线性映射，提出了一种利用这些线性映射作为特征的规模反馈算法，并将其应用于 Code.org Hour of Code 和 Stanford University 的 CS1 课程的编程测评中。

May, 2015

使用循环神经网络自动纠正编程作业中的语法错误

使用递归神经网络 (RNNs) 生成自动化反馈以修复编程任务中的语法错误，可以完全修复 31.69% 的提交并部分修正 6.39% 的提交。

Mar, 2016

基于图形的自监督程序修复技术，利用诊断反馈

本文提出了一种基于程序 -- 反馈图的图神经网络及一种用非监督学习方法构建大量程序修复样例的自监督学习范式。最终应用的 DrRepair 算法在两个应用领域上都取得了比之前的工作更好的修复效果。

May, 2020

训练于编程语言的语言模型中有意义迹象的证据

本文研究使用程序语言这一中间测试平台，探究语言模型是否能够理解语义，并发现 Transform 模型可通过样例抽象出当前和未来程序状态，使用的探测器准确率与执行输入所生成的程序一致。文中还提出了一种语义干预的实验方法，并展示了模型能够生成更短、更正确的程序。

May, 2023