Mar, 2019

又一种加速的 SGD: 在 ImageNet 上以 74.7 秒的速度训练 ResNet-50

TL;DR通过优化方法,我们使用 ABCI 集群上的 2048 个 GPU,在 74.7 秒内实现了高达 1.73 百万张图像 / 秒的训练吞吐量和 75.08%的 top-1 验证准确性,解决了分布式深度学习中大规模集群高伸缩性和高准确性的挑战。