BriefGPT.xyz
Dec, 2014
使用FBFFT的快速卷积神经网络:GPU性能评估
Fast Convolutional Nets With fbfft: A GPU Performance Evaluation
HTML
PDF
Nicolas Vasilache, Jeff Johnson, Michael Mathieu, Soumith Chintala, Serkan Piantino...
TL;DR
本文研究了卷积神经网络在当前NVIDIA图形处理器上的性能,介绍了两种新的快速傅立叶变换卷积实现,对于整个CNN,fbfft比cuFFT快1.5倍以上,并且对于许多普通的卷积层,速度也比NVIDIA的cuDNN实现 快(达到了一些合成内核配置的23.5倍)。
Abstract
We examine the performance profile of
convolutional neural network
training on the current generation of
nvidia graphics processing units
. We introduce two new
→