Mar, 2019

为大规模深度学习系统辩护:智能算法胜于硬件加速

TL;DR本研究提出了一种基于 CPU 的深度学习引擎 SLIDE,采用智能随机算法、多核并行和工作负载优化,通过针对大规模完全连接网络的训练,相对于优化的 Tensorflow(TF)在最佳可用 GPU 上进行训练,在任何给定准确性水平下,使用仅仅一个 44 核 CPU,SLIDE 的训练速度比 TF 快 3.5 倍(1 小时与 3.5 小时相比)。在相同的 CPU 硬件上,SLIDE 比 TF 快 10 倍以上。