Nov, 2015

神经GPU学习算法

TL;DR本研究提出一种神经网络结构——神经GPU来解决Neural Turing Machine中存在的训练难题,实现了对于尺寸不确定的输入进行算法训练,并能成功地推广到更长的算法实例中。通过参数共享放松、少量的dropout和渐变噪声的技术应用,神经GPU在训练和泛化方面收到了显著的正面效应。