自然语言规格说明到数学程序的综合

ICLRMar, 2023

自然语言规格说明到数学程序的综合

Synthesis of Mathematical programs from Natural Language Specifications

Ganesh Prasath, Shirish Karande

TL;DR研究评估了使用数据增强、后处理和代码生成模型 CodeT5 合成数学程序的效果，通过应用线性规划规则来评分和纠正光束，该方法基于自然语言规范实现自动化建模。实验结果表明，在使用这些增强方法后，CodeT5 基础版本的执行准确率为 0.73，明显优于 ChatGPT 的零 - shot 执行准确率 0.41 和 Codex 的 0.36。

Abstract

Several decision problems that are encountered in various business domains can be modeled as mathematical programs, i.e. optimization problems. The process of conducting such modeling often requires the involveme

mathematical programs optimization automl natural language specification codet5

发现论文，激发创造

自然语言程序合成

本论文提出了一个用自然语言输入构造程序合成器的框架，其使用 NLP 特征和关键词编程翻译的排名学习最优权重和分类器来代替学习并使用各种领域特定语言，可以用于编辑、智能教育系统和飞行信息查询等多个领域。通过 1200 多个英语说明，各合成器为 80％和 90％的说明将期望的程序排名为最好的一个和三个。

Sep, 2015

一个神经网络通过程序综合和少样本学习在人类水平上解决、解释和生成大学数学问题

该研究通过神经网络在预训练文本的基础上微调代码，解决了人类水平的数学问题，进行了程序综合，并生成了新问题。

Dec, 2021

大语言模型的程序综合

本文探索了大型语言模型在通用编程语言的程序合成方面的局限性，并在新的基准测试中评估了这些模型的性能。作者在两个基准测试（MBPP 和 MathQA-Python）上测试了这些模型，结果表明这些模型的性能随着其大小的增加而呈现对数线性关系。他们研究了这些模型进行对话以及语意建模的能力，并发现即使是最好的模型也无法完全预测某些程序的输出。

Aug, 2021

贝叶斯合成概率编程自动数据建模

使用贝叶斯综合技术，通过概率领域专用数据建模语言自动生成概率计算程序进行数据分析、解释和预测，并应用于时间序列数据和多元表格数据的分析，结果表明该技术可以准确推断多个真实世界数据的定性结构，优于标准的数据分析方法。

Jul, 2019

大型语言模型与自动化机器学习的协同效应

使用大型语言模型 (LLMs) 驱动的代码生成在最近变得越来越流行。然而，自动生成机器学习 (ML) 任务的代码仍然面临着重大挑战。本文通过结合 LLMs 和自动化机器学习 (autoML) 来探索 ML 程序合成的极限，旨在完全自动化从数据准备到建模和后处理的整个 ML 工作流程的代码生成过程，只使用 ML 任务的文本描述。

May, 2024

神经符号推理用于规划：通过大型语言模型和可满足性求解的反例引导归纳合成

使用方便的自然语言进行交流，结合生成式大型语言模型和可满足模理论求解器，可以生成可验证的正确解决方案。

Sep, 2023

从自然语言到代码：利用数据进行程序合成

本文提出了一种利用输入数据对候选程序程序进行语义重新排序，并结合高低温度混合的技术，能够有效提升在数据操作领域中使用大型语言模型生成正确程序的准确性。

May, 2023

利用语法和强化学习进行神经程序合成

本文提出了两种新的方法来解决程序合成中的限制，分别通过增加语义正确生成的概率和语法正确的程序的概率来解决。

May, 2018

强化学习引导下的程序合成树搜索

本文提出了一种新的程序合成方法，将寻找最优程序的问题转化为基于强化学习的马尔科夫决策过程，并将这种方法应用于浮点数 RISC-V 汇编语言的子集上，并结合基于搜索技术的优先搜索树，证明了我们的方法相较于其他基线方法的优越性

Jun, 2018

AlphaMath 几乎接近零：无过程的过程监督

利用 Monte Carlo Tree Search (MCTS) 框架和大型语言模型 (LLMs) 自动生成解决步骤和评估信号，训练一个逐步价值模型以提高 LLM 在数学领域中的推理过程。实验证明，采用 LLMs 结合 MCTS 自动生成的解决方案显著提高了模型处理复杂数学推理任务的能力。

May, 2024