Jul, 2020
通过非线性多重网格实现深度残差神经网络的 GPU 并行层间训练
Layer-Parallel Training with GPU Concurrency of Deep Residual Neural Networks via Nonlinear Multigrid
Andrew C. Kirby, Siddharth Samsi, Michael Jones, Albert Reuther, Jeremy Kepner...
TL;DR利用多重网格完全逼近存储算法来解决深度残差神经网络的训练,并在 GPU 上实现神经网络分层的并行化训练和并发计算核执行,这项工作显示出与传统的分层模型并行技术相比具有 10.2 倍的速度提升。