BriefGPT.xyz
Nov, 2018
GPipe:使用流水线并行化高效训练巨型神经网络
GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
HTML
PDF
Yanping Huang, Yonglong Cheng, Dehao Chen, HyoukJoong Lee, Jiquan Ngiam...
TL;DR
GPipe是一种管道并行库,它提供了一种高效进行模型并行化的方式,可以将不同子层序列分别放在不同的加速器上,因此可以有效地将各种不同的网络扩展到巨大的规模,并且能够实现快速的线性加速,通过对两个不同任务的训练,证明了GPipe的优势。
Abstract
gpipe
is a scalable
pipeline parallelism
library that enables learning of giant
deep neural networks
. It partitions network layers across
→