外星编码
本文提出了一种Neuro-Symbolic Program Synthesis技术,通过计算机程序自动构建特定领域的语言。我们通过使用两种新颖的神经模型,交叉相关的I/O网络和递归反向递归神经网络,证明了该方法的有效性。
Nov, 2016
本文研究给定样例输入输出对自动生成代码的问题,使用神经网络从当前状态和输出映射到程序的下一个语句,同时优化多个任务:从一组高级命令选择下一个操作,确定下一个语句的操作数以及可以从内存中删除哪些变量。使用该方法,我们能够创建比现有最先进的解决方案长两倍以上的程序,同时提高了相似长度的成功率,缩短了两个数量级的运行时间。我们的代码,包括各种文献基线的实现,可以在此 https URL 公开获取。
Sep, 2018
SAPS是一种神经网络模型,利用抽象语法树、预训练的词向量和双向多层LSTM等方法,将自然语言描述转换成可执行代码,其准确率超过92%,不需要后处理,是一种实现程序合成的高效方法。
Oct, 2018
本文提出了一种名为 PATOIS 的系统,它通过自动挖掘常见的代码习惯用法,并将其合并到神经程序合成语言中,通过训练基于树结构的神经合成器来使用这些模式,以在每一代步骤中显式地交错高级别和低级别推理来实现通用源代码从自然语言规范中的程序合成。评估表明,使用这类学习的代码习惯可以提高综合器的准确性,其中使用了两个复杂的语义解析数据集。
Jun, 2019
该论文提出了一种利用具有特定搜索目的的输出表示形式来解决大规模空间搜索问题的方法,通过先使用自监督训练离散自编码器,再将结果离散潜在编码用作建立端到端序列预测任务的中间目标来学习离散潜在编码,基于这些研究成果提出了一种名为'Latent Programmer'的程序合成方法,实验证明使用离散潜在表示显著提高了合成精度。
Dec, 2020
我们提出了一种自学习方法,用于从整数序列合成程序。我们的系统测试了在OEIS表格上,通过基本操作并在没有人工训练例子的情况下,自主发现了27987个序列的解决方案。
Feb, 2022
本文介绍了一种能够修改自身源代码的自编程人工智能系统,通过应用基于AI的代码生成,实现了对自身深度学习模型设计和学习动态的算法优化,证明了其能够成功地改进自身性能,并编程子模型来执行辅助任务。
Apr, 2022
本文提出使用预先训练的语言模型和部分正确的解决方案来解决数学推理问题的训练方法,并探索了各种训练目标对性能的影响。部分正确的解决方案有助于模型对解决方案空间进行更有效的探索。在两个数学推理数据集上的实验显示出方法的有效性。
May, 2022
该论文提出了 SLaDe,一种基于序列到序列变换器的小语言模型反编译器,利用类型推断生成比标准分析和最近的神经方法更易读和准确的代码,相比最先进的市场反编译器 Ghidra 更精确,相对于 ChatGPT 大型语言模型具有更好的可读性。
May, 2023
基于神经网络的机制可解释性自动合成方法MIPS,将学习到的算法自动转化为Python代码,解决了62个可以由RNN学习的算法任务中的32个问题,并对GPT-4的补充具有高度互补性,且不使用人工训练数据。
Feb, 2024