Jul, 2020

通过非线性多重网格实现深度残差神经网络的 GPU 并行层间训练

TL;DR利用多重网格完全逼近存储算法来解决深度残差神经网络的训练,并在 GPU 上实现神经网络分层的并行化训练和并发计算核执行,这项工作显示出与传统的分层模型并行技术相比具有 10.2 倍的速度提升。