Mar, 2016

适应性计算时间的递归神经网络

TL;DR本文介绍了一种自适应计算时间(ACT)的算法,它使得循环神经网络能够在接收输入和输出之间学习要执行多少计算步骤。ACT 要求最少的网络架构变化,并且是确定性和可微分的,在不会增加参数梯度的噪声的情况下表现良好。实验结果证明,ACT 在决定二进制向量的奇偶性,应用二元逻辑操作,加法和对真实数字排序的四个综合问题上表现出了显着的性能改进。此外,本文还在 Hutter 奖 Wikipedia 数据集上展示了字符级别的语言建模结果,ACT 在该场景下性能提升不是很大,但是它提供了对数据结构的引人瞩目的见解,更多的计算分配给了难以预测的转换,比如单词之间的空格和句子结束。这表明,ACT 或其他自适应计算方法可能提供一种推断序列数据分段边界的通用方法。