Oct, 2015
ZNN - 一个快速可扩展的算法,用于在多核和众核共享内存机器上训练 3D 卷积网络
ZNN - A Fast and Scalable Algorithm for Training 3D Convolutional
Networks on Multi-Core and Many-Core Shared Memory Machines
TL;DR本研究介绍了一种基于任务分解的并行算法ZNN,它能够在计算机视觉中应用广泛的卷积神经网络中实现PRAM模型下的线性加速,通过时间局部化和一种几乎无等待的并发方法,此算法能够在共享内存机器上达到与物理核心数量相当的加速效果,适用于宽网络结构。此算法基于CPU的任务并行性,与GPU的SIMD并行性相比,ZNN的开发和维护成本相对较低。