Jul, 2015

网格长短时记忆

TL;DR本文介绍了Grid Long Short-Term Memory,这是一种由LSTM单元组成的多维网格网络,可用于向量、序列或图像等更高维的数据。该网络在现有深度LSTM架构中的不同之处在于单元不仅在网络层之间连接,也连接在数据的时空维度上,提供了一种统一的使用LSTM进行深层次和序列计算的方法。我们将模型应用于15位整数加法和序列记忆等算法任务,发现其能够显著优于标准LSTM。我们还给出了两个实证任务的结果。2D Grid LSTM在维基百科字符预测基准测试中达到了1.47位/字符,这是神经方法中的最佳结果。此外,我们使用Grid LSTM定义了一种新的二维翻译模型Reencoder,并表明其在中英翻译任务上优于基于短语的参考系统。