Nov, 2018

GPipe:使用流水线并行化高效训练巨型神经网络

TL;DRGPipe是一种管道并行库,它提供了一种高效进行模型并行化的方式,可以将不同子层序列分别放在不同的加速器上,因此可以有效地将各种不同的网络扩展到巨大的规模,并且能够实现快速的线性加速,通过对两个不同任务的训练,证明了GPipe的优势。