Oct, 2015

ZNN - 一个快速可扩展的算法,用于在多核和众核共享内存机器上训练 3D 卷积网络

TL;DR本研究介绍了一种基于任务分解的并行算法 ZNN,它能够在计算机视觉中应用广泛的卷积神经网络中实现 PRAM 模型下的线性加速,通过时间局部化和一种几乎无等待的并发方法,此算法能够在共享内存机器上达到与物理核心数量相当的加速效果,适用于宽网络结构。此算法基于 CPU 的任务并行性,与 GPU 的 SIMD 并行性相比,ZNN 的开发和维护成本相对较低。