NIPSNov, 2017

在 ImageNet 数据集上使用极大的 Minibatch SGD 训练 ResNet-50 模型只需 15 分钟

TL;DR使用大批量大小的训练技术,如 RMSprop 预热、批量归一化等方法,我们成功地在 15 分钟内使用 1024 个 Tesla P100 GPU 在 ImageNet 数据集上对 ResNet-50 进行了 90 轮训练,并在此过程中保持了准确性。