高效实用的信息化规范下程序综合
本文介绍了一种面向编程求解的领域特定语言TerpreT,它能够通过四种不同的后端进行推理,探索了不同领域、程序表示和解释模型的应用,并将模型说明与推理算法分离,提供了比较不同推理方法的基础。通过对多种程序模型的若干解释器模型进行广泛的经验比较,本文认为约束求解器优于基于梯度下降和基于LP松弛的方法。
Dec, 2016
本文探索了大型语言模型在通用编程语言的程序合成方面的局限性,并在新的基准测试中评估了这些模型的性能。作者在两个基准测试(MBPP和MathQA-Python)上测试了这些模型,结果表明这些模型的性能随着其大小的增加而呈现对数线性关系。他们研究了这些模型进行对话以及语意建模的能力,并发现即使是最好的模型也无法完全预测某些程序的输出。
Aug, 2021
本文介绍了一种基于大型语言模型的程序合成方法,其中所训练的模型在自然语言处理和编程语言数据上具有竞争力,以及构建的开放式基准Multi-Turn Programming Benchmark,该基准将单个程序分解为多个提示,从而显着提高了程序综合的准确性。本文提供了JAXFORMER的开放源码,以便更广泛地使用。
Mar, 2022
本文提出使用预先训练的语言模型和部分正确的解决方案来解决数学推理问题的训练方法,并探索了各种训练目标对性能的影响。部分正确的解决方案有助于模型对解决方案空间进行更有效的探索。在两个数学推理数据集上的实验显示出方法的有效性。
May, 2022
本文基于大型语言模型,提出了一种改进程序综合器可靠性和总体准确性的方法,通过语言模型自然语言描述求解程序问题,并且学习分析程序和断言的一致性,以判断哪个程序最有可能是正确的,从而通过提供可信的解决方案来改善可靠性
Sep, 2022
在程序综合中,通过使用Rational Speech Acts(RSA)框架,一个智能系统接收用户生成的示例集合并返回与这些示例在逻辑上一致的程序。本文介绍了一种使用全局实用排序的新型RSA算法摊销方法,通过该方法可以在在线、多示例设置中有效地近似全面实用的综合器,并相比RSA综合器获得数量级的速度提升,同时胜过非实用综合器。
Sep, 2023
本文提出了一种使用神经网络在编程示例中选择信息性数据集的新方法,并在合成正则表达式任务上验证了该方法的有效性,相对于不选择信息性示例训练的模型,其性能提高了23%(相对增长了51%),并且与使用人类数据进行训练的监督学习模型的表现相当。
Nov, 2023
利用理性言语行为(RSA)框架在构建与用户生成的例子逻辑一致且注重用户选择例子信息性的计算机程序综合器方面取得了成功。本研究提出了一种摊销慢速、精确的RSA综合器的通用方法,通过先查询精确的RSA综合器来编制一个通信数据集,这一数据集包含了与程序子集相关的示例依赖排序。然后将这些排序抽取为对所有程序的单个全局排序,以近似数据集中的每个排序。在推理时,使用该全局排序来对由一个快速、非实用的综合器生成的多个逻辑一致的候选程序进行排序。在两个程序综合领域的实验中,我们的排序方法相比于精确的RSA综合器获得了数量级的加速度,并在与人类交流时比一个非实用的综合器更准确。最后,我们证明了在从单个例子进行综合的特殊情况下,此近似方法是精确的。
Jun, 2024