Oct, 2018

气候分析的 Exascale 深度学习

TL;DR使用 Tiramisu 和 DeepLabv3 + 神经网络的变体提取极端天气模式的像素级掩模。通过改进软件框架、输入管道和网络训练算法以有效地扩展 Piz Daint 和 Summit 系统上的深度学习。Tiramisu 网络具有 5300 个 P100 GPU,持续吞吐量为 21.0 PF/s,并且具有 79.0% 的并行效率。DeepLabv3 + 可扩展至 27360 个 V100 GPU,在单精度下具有 325.8 PF/s 的持续吞吐量和 90.7% 的并行效率。通过利用 FP16 Tensor Cores,DeepLabv3 + 网络的半精度版本实现了 1.13 EF/s 的峰值吞吐量和 999.0 PF/s 的持续吞吐量。