Mar, 2019
为大规模深度学习系统辩护:智能算法胜于硬件加速
SLIDE : In Defense of Smart Algorithms over Hardware Acceleration for Large-Scale Deep Learning Systems
Beidi Chen, Tharun Medini, James Farwell, Sameh Gobriel, Charlie Tai...
TL;DR本研究提出了一种基于 CPU 的深度学习引擎 SLIDE,采用智能随机算法、多核并行和工作负载优化,通过针对大规模完全连接网络的训练,相对于优化的 Tensorflow(TF)在最佳可用 GPU 上进行训练,在任何给定准确性水平下,使用仅仅一个 44 核 CPU,SLIDE 的训练速度比 TF 快 3.5 倍(1 小时与 3.5 小时相比)。在相同的 CPU 硬件上,SLIDE 比 TF 快 10 倍以上。