ICLRDec, 2014

使用 FBFFT 的快速卷积神经网络:GPU 性能评估

TL;DR本文研究了卷积神经网络在当前 NVIDIA 图形处理器上的性能,介绍了两种新的快速傅立叶变换卷积实现,对于整个 CNN,fbfft 比 cuFFT 快 1.5 倍以上,并且对于许多普通的卷积层,速度也比 NVIDIA 的 cuDNN 实现 快(达到了一些合成内核配置的 23.5 倍)。