Jan, 2018

具有优先队列训练的神经程序合成

TL;DR研究程序综合,基于输出的奖励函数,通过优化方法和利用循环神经网络 (RNN) 训练找到最优解。使用 BF 语言进行基准测试,证明 priority queue training (PQT) 算法比遗传算法和强化学习算法更有效。同时,在奖励函数中增加程序长度惩罚,可合成简洁易读的程序。