SPoC: 基于搜索的伪代码到代码

Jun, 2019

SPoC: Search-based Pseudocode to Code

Sumith Kulal, Panupong Pasupat, Kartik Chandra, Mina Lee, Oded Padon...

TL;DR使用编译错误信号进行归因分配的伪代码到程序的综合。

Abstract

We consider the task of mapping pseudocode to long programs that are functionally correct. Given test cases as a mechanism to validate programs, we search over the space of possible translations of the pseudocode

pseudocode credit assignment program synthesis compilation errors search-based

发现论文，激发创造

低资源编程语言伪代码生成的知识转移

该论文提出通过迭代回译的方法，借助已有的高资源编程语言（C++）的代码 - 伪代码数据，将训练好的 C++-to - 伪代码模型迁移到没有对应数据的遗留编程语言（C）上，从而实现对其代码的自动描述，取得了 23.27% 的成功率提升。

Mar, 2023

基于上下文感知代码翻译的代码搜索

提出了一种新的上下文感知代码翻译技术，将代码片段翻译成自然语言描述，并使用单一词汇表为翻译和查询生成嵌入，名为 TranCS，实验证明其显著优于最先进技术。

Feb, 2022

sk_p: 用于 MOOC 的神经编程纠错器

本文提出了一种用于自动纠正 MOOCs 中程序错误的新技术，能够修复语法和语义错误而不需要手动进行问题特定的纠正策略，实验表明本方案可以更有效地修正程序错误。

Jul, 2016

联合预测的信用分配编译器

本文介绍了一种新的学习搜索方法，通过将复杂的决策问题转化为搜索空间的一系列决策，从而实现多个相互依赖输出变量的联合预测任务，并将其定义为任意命令程序的搜索空间，通过算法改进和编译器将编程和运行时间的复杂度大大降低，其效果在多个预测任务中获得了与替代方法相当的准确性。

Jun, 2014

自动提取伪代码的扩展规模

通过从 arXiv 论文中提取近 320,000 个伪代码示例，我们创建了一个庞大的伪代码集合。我们的方法包括一个定制化的提取机制和一个基于随机抽样的验证机制，以优化覆盖范围并检查准确性和可靠性。同时，通过聚类和统计分析，我们提供了对常见伪代码结构的洞察，表明伪代码的使用呈现出指数型增长，凸显其不断增加的重要性。

Jun, 2024

学习代码习语的程序综合和语义解析

本文提出了一种名为 PATOIS 的系统，它通过自动挖掘常见的代码习惯用法，并将其合并到神经程序合成语言中，通过训练基于树结构的神经合成器来使用这些模式，以在每一代步骤中显式地交错高级别和低级别推理来实现通用源代码从自然语言规范中的程序合成。评估表明，使用这类学习的代码习惯可以提高综合器的准确性，其中使用了两个复杂的语义解析数据集。

Jun, 2019

我说，你验证：朝向值得信赖的神经程序合成

本文基于大型语言模型，提出了一种改进程序综合器可靠性和总体准确性的方法，通过语言模型自然语言描述求解程序问题，并且学习分析程序和断言的一致性，以判断哪个程序最有可能是正确的，从而通过提供可信的解决方案来改善可靠性

Sep, 2022

使用局部搜索优化程序：你能优化我的代码吗？

本文介绍了一种用于改进现有程序的本地搜索方法，即基于单项游戏评分提高程序效率的 POLIS 方法，在 27 人的用户研究中得到验证，可以作为可衡量目标的编程问题的有用助手。

Jul, 2023

程序超优化学习

本研究提出了一种新的基于学习的方法来对程序进行超优化，该方法利用无偏估计梯度来学习建议分布以提高程序性能，实验表明，该方法能够在超优化方面显着优于现有的基于规则和基于随机搜索的方法。

Nov, 2016

SUT: 转换器模型的主动缺陷探测

自动程序翻译具有巨大的应用价值，但当前的翻译模型在基本的语法错误方面仍存在问题。本论文介绍了针对编程语言翻译的新指标和一套包括高度可解释的评估工具的测试套件，实验证明即使是像 ChatGPT 这样强大的模型在基本单元测试上也存在错误。

Oct, 2023