外星编码

Jan, 2023

Alien Coding

Thibault Gauthier, Miroslav Olšák, Josef Urban

TL;DR本文介绍了一种自学习算法来合成OEIS数列的程序，该算法使用神经机器翻译以及其自身的智能推理能力探索解决方案，发现了超过78000个OEIS数列的程序，并开创了新的编程方法。

Abstract

We introduce a self-learning algorithm for synthesizing programs for oeis sequences. The algorithm starts from scratch initially generating programs at random. Then it runs many iterations of a self-learning loop

发现论文，激发创造

神经符号程序合成

本文提出了一种Neuro-Symbolic Program Synthesis技术，通过计算机程序自动构建特定领域的语言。我们通过使用两种新颖的神经模型，交叉相关的I/O网络和递归反向递归神经网络，证明了该方法的有效性。

Nov, 2016

具有学习垃圾收集器的长程序的自动程序合成

本文研究给定样例输入输出对自动生成代码的问题，使用神经网络从当前状态和输出映射到程序的下一个语句，同时优化多个任务：从一组高级命令选择下一个操作，确定下一个语句的操作数以及可以从内存中删除哪些变量。使用该方法，我们能够创建比现有最先进的解决方案长两倍以上的程序，同时提高了相似长度的成功率，缩短了两个数量级的运行时间。我们的代码，包括各种文献基线的实现，可以在此 https URL 公开获取。

Sep, 2018

自然语言结构感知程序综合：没有时间编码

SAPS是一种神经网络模型，利用抽象语法树、预训练的词向量和双向多层LSTM等方法，将自然语言描述转换成可执行代码，其准确率超过92％，不需要后处理，是一种实现程序合成的高效方法。

Oct, 2018

学习代码习语的程序综合和语义解析

本文提出了一种名为 PATOIS 的系统，它通过自动挖掘常见的代码习惯用法，并将其合并到神经程序合成语言中，通过训练基于树结构的神经合成器来使用这些模式，以在每一代步骤中显式地交错高级别和低级别推理来实现通用源代码从自然语言规范中的程序合成。评估表明，使用这类学习的代码习惯可以提高综合器的准确性，其中使用了两个复杂的语义解析数据集。

Jun, 2019

潜在程序员：离散潜在编码用于程序综合

该论文提出了一种利用具有特定搜索目的的输出表示形式来解决大规模空间搜索问题的方法，通过先使用自监督训练离散自编码器，再将结果离散潜在编码用作建立端到端序列预测任务的中间目标来学习离散潜在编码，基于这些研究成果提出了一种名为'Latent Programmer'的程序合成方法，实验证明使用离散潜在表示显著提高了合成精度。

Dec, 2020

从零开始学习整数序列的程序综合

我们提出了一种自学习方法，用于从整数序列合成程序。我们的系统测试了在OEIS表格上，通过基本操作并在没有人工训练例子的情况下，自主发现了27987个序列的解决方案。

Feb, 2022

使用代码生成语言模型进行自编程人工智能

本文介绍了一种能够修改自身源代码的自编程人工智能系统，通过应用基于AI的代码生成，实现了对自身深度学习模型设计和学习动态的算法优化，证明了其能够成功地改进自身性能，并编程子模型来执行辅助任务。

Apr, 2022

从自采样的正确和部分正确的解中学习数学推理

本文提出使用预先训练的语言模型和部分正确的解决方案来解决数学推理问题的训练方法，并探索了各种训练目标对性能的影响。部分正确的解决方案有助于模型对解决方案空间进行更有效的探索。在两个数学推理数据集上的实验显示出方法的有效性。

May, 2022

SLaDe: 一个用于优化汇编代码的可移植小型语言模型反编译器

该论文提出了 SLaDe，一种基于序列到序列变换器的小语言模型反编译器，利用类型推断生成比标准分析和最近的神经方法更易读和准确的代码，相比最先进的市场反编译器 Ghidra 更精确，相对于 ChatGPT 大型语言模型具有更好的可读性。

May, 2023

AI黑盒子的开启：基于机械解释的程序合成

基于神经网络的机制可解释性自动合成方法MIPS，将学习到的算法自动转化为Python代码，解决了62个可以由RNN学习的算法任务中的32个问题，并对GPT-4的补充具有高度互补性，且不使用人工训练数据。

Feb, 2024