用属性签名学习表示程序

Feb, 2020

Learning to Represent Programs with Property Signatures

Augustus Odena, Charles Sutton

TL;DR本文提出了一种可供机器学习算法使用的程序和程序规范的表示方法——属性签名，其中属性是一个输入输出类型的函数，描述所研究函数的某个简单特性。通过对一组输入输出对进行评估可得到属性签名，本文证明属性签名可用于改进基线程序合成器的性能。

Abstract

We introduce the notion of property signatures, a representation for programs and program specifications meant for consumption by machine learning algorithms. Given a function with input type $\tau_{in}$ and outp

发现论文，激发创造

基于路径的通用程序属性预测表示

提出一种基于路径的编程语言自动学习表示方法，其将程序表示为其抽象语法树中的路径，可用于预测变量名称、方法名称和完全类型，并可跨不同编程语言驱动不同的学习算法。

Mar, 2018

学习推理程序草图

本文介绍一种用于程序自动合成的方法，通过结合模式识别和显式推理来解决这些复杂的编程问题，同时使用新颖的中间表示和训练算法，使程序合成系统能够自学，从而在简单的英文描述编程问题数据集上取得了最先进的性能表现。

Feb, 2019

使用混合抽象语义表示部分程序

通过神经符号表示以及基于抽象解释衍生的执行模型，我们提供了一种表示部分程序的一般技术。这种技术可以帮助程序综合引擎在寻找程序解决方案时使用更强大的语言结构，从而在给定的搜索预算内更准确地综合程序。

Dec, 2020

自动测试代码转换模型的功能属性

大型语言模型在不同编程语言之间进行翻译的过程中变得越来越实用，但关键问题在于生成的代码是否准确。本文提出了第一种用于自动进行功能属性测试的代码翻译模型的方法，并探讨了基于属性的代码翻译模型搜索过程，结果显示该方法能够有效检测流行代码翻译模型中的属性违规并获得更好的代码翻译。

Sep, 2023

增强数据流分析的学习类型推断

CodeTIDAL5是一种基于Transformer的模型，用于可靠地预测类型注释，并从程序的代码属性图中提取使用片段，其在ManyTypes4TypeScript基准测试上优于当前最先进的神经类型推理系统7.85％，总体准确率达到71.27％。

Oct, 2023

面向证明导向编程的神经综合研究

使用AI自动化构建证明导向的程序，我们提供了一个包含600K行开源F*程序和证明的数据集，通过AI进行程序和证明的综合，使用细调小型语言模型和类型检索增强技术取得有希望的结果，为未来改进提供了方向。

May, 2024

PropertyGPT：通过递归加智能规则生成从而实现智能合约的LLM驱动形式验证

利用大型语言模型，本研究提出了PropertyGPT系统，该系统可以通过生成可编译、适当且可验证的自定义属性来检测代码缺陷和安全漏洞，实验结果显示其能够生成高质量的属性，相较于真实情况，其召回率达到80％。

May, 2024

miniCodeProps：证明代码属性的最小基准

利用神经网络的数学定理证明、代码验证和自动化定理证明等领域的研究，提出了一个测试用例，旨在进一步发展形式验证代码的自动定理证明。

Jun, 2024

用机器学习推断可插拔类型

使用机器学习自动推断类型限定符的可插入式类型系统研究，提出了一种编码最小数据流提示的新型表示方式 NaP-AST，并评估了多种模型架构，包括图变换网络（Graph Transformer Network），图卷积网络（Graph Convolutional Network）和大型语言模型。研究中还验证了这些模型在 12 个开源项目中的性能，并进行了一个可行性研究，结果发现在大约 16k 个类时性能有所提升，在约 22k 个类时由于过拟合而恶化。

Jun, 2024

作为归纳编程的超级启发式方法的测试用例特征

使用测试用例类型签名作为超启发式算法，选择多个较小的指令子集家族，以进一步减小归纳编程搜索空间的大小。

Jun, 2024