高效实用的信息化规范下程序综合

Apr, 2022

高效实用的信息化规范下程序综合

Efficient Pragmatic Program Synthesis with Informative Specifications

Saujas Vaduguru, Kevin Ellis, Yewen Pu

TL;DR本文提出了一种程序合成算法，实现了基于因素的近似模型，对于用户提供的示例更为有效，相较于采用精确的显式因素模型，在自然语言输入场景下，该合成器可以实现更好的性能。

Abstract

Providing examples is one of the most common way for end-users to interact with program synthesizers. However, program synthesis systems assume that examples consistent with the program are chosen at random, and do not exploit the fact that users choose examples pragmatically. Prior wo

发现论文，激发创造

TerpreT：一种用于程序归纳的概率编程语言

本文介绍了一种面向编程求解的领域特定语言TerpreT，它能够通过四种不同的后端进行推理，探索了不同领域、程序表示和解释模型的应用，并将模型说明与推理算法分离，提供了比较不同推理方法的基础。通过对多种程序模型的若干解释器模型进行广泛的经验比较，本文认为约束求解器优于基于梯度下降和基于LP松弛的方法。

Dec, 2016

基于神经草图学习的条件程序生成

本研究使用神经网络生成API-heavy Java代码，根据方法中仅出现的几个API调用或数据类型，生成满足语法和语义约束的源代码。

Mar, 2017

利用语法和强化学习进行神经程序合成

本文提出了两种新的方法来解决程序合成中的限制，分别通过增加语义正确生成的概率和语法正确的程序的概率来解决。

May, 2018

大语言模型的程序综合

本文探索了大型语言模型在通用编程语言的程序合成方面的局限性，并在新的基准测试中评估了这些模型的性能。作者在两个基准测试（MBPP和MathQA-Python）上测试了这些模型，结果表明这些模型的性能随着其大小的增加而呈现对数线性关系。他们研究了这些模型进行对话以及语意建模的能力，并发现即使是最好的模型也无法完全预测某些程序的输出。

Aug, 2021

CodeGen: 一个用于代码的开放式大语言模型，支持多轮程序综合

本文介绍了一种基于大型语言模型的程序合成方法，其中所训练的模型在自然语言处理和编程语言数据上具有竞争力，以及构建的开放式基准Multi-Turn Programming Benchmark，该基准将单个程序分解为多个提示，从而显着提高了程序综合的准确性。本文提供了JAXFORMER的开放源码，以便更广泛地使用。

Mar, 2022

从自采样的正确和部分正确的解中学习数学推理

本文提出使用预先训练的语言模型和部分正确的解决方案来解决数学推理问题的训练方法，并探索了各种训练目标对性能的影响。部分正确的解决方案有助于模型对解决方案空间进行更有效的探索。在两个数学推理数据集上的实验显示出方法的有效性。

May, 2022

我说，你验证：朝向值得信赖的神经程序合成

本文基于大型语言模型，提出了一种改进程序综合器可靠性和总体准确性的方法，通过语言模型自然语言描述求解程序问题，并且学习分析程序和断言的一致性，以判断哪个程序最有可能是正确的，从而通过提供可信的解决方案来改善可靠性

Sep, 2022

使用排序法摊销实用的程序合成

在程序综合中，通过使用Rational Speech Acts（RSA）框架，一个智能系统接收用户生成的示例集合并返回与这些示例在逻辑上一致的程序。本文介绍了一种使用全局实用排序的新型RSA算法摊销方法，通过该方法可以在在线、多示例设置中有效地近似全面实用的综合器，并相比RSA综合器获得数量级的速度提升，同时胜过非实用综合器。

Sep, 2023

生成实用示例用于训练神经程序合成器

本文提出了一种使用神经网络在编程示例中选择信息性数据集的新方法，并在合成正则表达式任务上验证了该方法的有效性，相对于不选择信息性示例训练的模型，其性能提高了23％（相对增长了51％），并且与使用人类数据进行训练的监督学习模型的表现相当。

Nov, 2023

利用排序规则分摊实用程序综合

利用理性言语行为（RSA）框架在构建与用户生成的例子逻辑一致且注重用户选择例子信息性的计算机程序综合器方面取得了成功。本研究提出了一种摊销慢速、精确的RSA综合器的通用方法，通过先查询精确的RSA综合器来编制一个通信数据集，这一数据集包含了与程序子集相关的示例依赖排序。然后将这些排序抽取为对所有程序的单个全局排序，以近似数据集中的每个排序。在推理时，使用该全局排序来对由一个快速、非实用的综合器生成的多个逻辑一致的候选程序进行排序。在两个程序综合领域的实验中，我们的排序方法相比于精确的RSA综合器获得了数量级的加速度，并在与人类交流时比一个非实用的综合器更准确。最后，我们证明了在从单个例子进行综合的特殊情况下，此近似方法是精确的。

Jun, 2024