Aug, 2017

15PF的深度学习: 面向科学数据的监督和半监督分类

TL;DR这篇论文介绍了第一个使用现代高性能计算架构解决科学模式分类问题的15-PetaFLOP深度学习系统。通过使用卷积神经网络对高能物理数据和气候数据进行监督和半监督建模,实现了在单个Cori Phase-II Xeon-Phi节点上达到2 TFLOP/s;在使用节点组之间的异步通信和同步节点组的混合策略的情况下,将单模型的训练扩展到9600个Xeon-Phi节点,达到了11.73-15.07 PFLOP/s峰值性能和11.41-13.27 PFLOP/s持续性能。最终,作者的高能物理和气候学模式分类问题的卷积神经网络表现出了超过那些高层次物理学特征选择所达到的最先进的分类准确性;而他们的半监督架构成功地在15TB的气候数据集中提取了天气模式,证明了深度学习在众核HPC系统上的有效优化和扩展.