利用（模糊测试）测试用例理解程序

ACLMay, 2023

利用（模糊测试）测试用例理解程序

Understanding Programs by Exploiting (Fuzzing) Test Cases

Jianyu Zhao, Yuyang Rong, Yiwen Guo, Yifeng He, Hao Chen

TL;DR通过模糊测试来提高程序理解和代码表示学习的性能，并将此关系纳入学习中，以实现程序的深层语义理解。该方法在代码克隆检测和代码分类等两个程序理解任务上表现出色

Abstract

semantic understanding of programs has attracted great attention in the community. Inspired by recent successes of large language models (LLMs) in natural language understanding, tremendous progress has been made

semantic understanding large language models program code fuzz testing code representation learning

发现论文，激发创造

代码表示预训练与程序执行的补充

本论文介绍了一种名为 FuzzPretrain 的方法，利用程序的测试用例中的动态信息，将其嵌入代码的特征表示中，以改善代码搜索的效果，并提供了学习具有区分性的代码表示的实验证据。

Sep, 2023

训练于编程语言的语言模型中有意义迹象的证据

本文研究使用程序语言这一中间测试平台，探究语言模型是否能够理解语义，并发现 Transform 模型可通过样例抽象出当前和未来程序状态，使用的探测器准确率与执行输入所生成的程序一致。文中还提出了一种语义干预的实验方法，并展示了模型能够生成更短、更正确的程序。

May, 2023

神经网络如何理解程序？

本文探讨了基于 NLP 预训练技术的代码表示学习的进展，提出了一种新的程序语义学习模式，即模型应该学习由与操作语义基本操作对齐的表示和不可或缺的环境转换信息构成的信息。为了验证我们的建议，我们提出了一个名为 OSCAR 的分层 Transformer 预训练模型，通过从 IR 和静态分析导出的编码表示中学习来表示基本操作和环境转换信息，证明了 OSCAR 在许多实际软件工程任务中理解程序语义的杰出能力。

May, 2021

基于大型语言模型的模糊测试技术综述

本文调查总结了截至 2024 年的最新方法，统计分析了三个领域（即 LLMs、模糊测试和基于 LLMs 的模糊测试），并探讨了将基于 LLMs 的模糊测试技术广泛应用于未来的潜力。

Feb, 2024

代码语法理解语言模型基准测试

这篇论文介绍了作者对现有预训练编程语言模型在理解代码结构方面的限制进行了全面的基准测试，并引入了一个大规模的数据集 CodeSyntax 来评估这些模型的性能，并揭示了自然语言和编程语言在理解语法结构方面的差异和重要性。

Oct, 2022

LLAMAFUZZ：大型语言模型加强的灰盒模糊测试

利用预训练的大型语言模型 (LLM) 增强结构化数据的灰盒模糊测试，通过利用 LLM 的先前训练知识和基于 Magma 等基准的实验，LLAMAFUZZ 比其他方法平均提高了 41 个漏洞的检测，实现了一致的性能提升。

Jun, 2024

从自然语言到代码：利用数据进行程序合成

本文提出了一种利用输入数据对候选程序程序进行语义重新排序，并结合高低温度混合的技术，能够有效提升在数据操作领域中使用大型语言模型生成正确程序的准确性。

May, 2023

函数约束的程序综合

该研究介绍了一种技术，它允许大型语言模型在解决编程任务时利用用户提供的代码，并且提出了一种逐步生成模块化子函数的方法，以帮助模型在初始生成的代码不足时进行未来的代码生成尝试。

Nov, 2023

基于信息论和对比学习的方法，识别导致软件漏洞的代码语句

通过深度学习方法及聚类空间对比学习，精准识别程序漏洞中的漏洞相关代码语句，本方法运用于现实数据集上优于其他最新基线算法，显著提高 VCP、VCA、Top-10 ACC 等效果。

Sep, 2022

DeepCode AI Fix: 用大型语言模型修复安全漏洞

使用大型语言模型的程序修复任务中，通过降低训练数据量、使用代码剪裁技术及构建全面的代码修复数据集，我们的系统能够在更少的案例中准确匹配人工修复，并显著提升可用模型的性能。

Feb, 2024