ICLRMar, 2022

使用多网格求解器并行训练 GRU 神经网络处理长序列

TL;DR该论文提出了一种新的并行剪枝方案(称为 “并行化时间”),基于多网格时间缩减(MGRIT)求解器对 GRU 进行训练,可以在序列长度增加时显著提高性能,实验结果显示,与串行方法相比,新的并行化训练方案实现了高达 6.5 倍的加速比。