ICLRSep, 2017

基于序列长度的线性循环神经网络并行化

TL;DR该研究论文描述了使用线性顺序依赖关系的 RNN 可以使用并行扫描算法在序列长度上进行并行化训练,通过开发并行线性递归 CUDA 内核,加速多种最先进的 RNN 架构的训练和推理,扩展序列学习到以前无法触及的极长序列区域并成功训练 GILR-LSTM 进行一百万时间步长的合成序列分类任务。