用属性签名学习表示程序
提出一种基于路径的编程语言自动学习表示方法,其将程序表示为其抽象语法树中的路径,可用于预测变量名称、方法名称和完全类型,并可跨不同编程语言驱动不同的学习算法。
Mar, 2018
本文介绍一种用于程序自动合成的方法,通过结合模式识别和显式推理来解决这些复杂的编程问题,同时使用新颖的中间表示和训练算法,使程序合成系统能够自学,从而在简单的英文描述编程问题数据集上取得了最先进的性能表现。
Feb, 2019
通过神经符号表示以及基于抽象解释衍生的执行模型,我们提供了一种表示部分程序的一般技术。这种技术可以帮助程序综合引擎在寻找程序解决方案时使用更强大的语言结构,从而在给定的搜索预算内更准确地综合程序。
Dec, 2020
大型语言模型在不同编程语言之间进行翻译的过程中变得越来越实用,但关键问题在于生成的代码是否准确。本文提出了第一种用于自动进行功能属性测试的代码翻译模型的方法,并探讨了基于属性的代码翻译模型搜索过程,结果显示该方法能够有效检测流行代码翻译模型中的属性违规并获得更好的代码翻译。
Sep, 2023
CodeTIDAL5是一种基于Transformer的模型,用于可靠地预测类型注释,并从程序的代码属性图中提取使用片段,其在ManyTypes4TypeScript基准测试上优于当前最先进的神经类型推理系统7.85%,总体准确率达到71.27%。
Oct, 2023
使用AI自动化构建证明导向的程序,我们提供了一个包含600K行开源F*程序和证明的数据集,通过AI进行程序和证明的综合,使用细调小型语言模型和类型检索增强技术取得有希望的结果,为未来改进提供了方向。
May, 2024
利用大型语言模型,本研究提出了PropertyGPT系统,该系统可以通过生成可编译、适当且可验证的自定义属性来检测代码缺陷和安全漏洞,实验结果显示其能够生成高质量的属性,相较于真实情况,其召回率达到80%。
May, 2024
使用机器学习自动推断类型限定符的可插入式类型系统研究,提出了一种编码最小数据流提示的新型表示方式 NaP-AST,并评估了多种模型架构,包括图变换网络(Graph Transformer Network),图卷积网络(Graph Convolutional Network)和大型语言模型。研究中还验证了这些模型在 12 个开源项目中的性能,并进行了一个可行性研究,结果发现在大约 16k 个类时性能有所提升,在约 22k 个类时由于过拟合而恶化。
Jun, 2024