Dec, 2014

使用FBFFT的快速卷积神经网络:GPU性能评估

TL;DR本文研究了卷积神经网络在当前NVIDIA图形处理器上的性能,介绍了两种新的快速傅立叶变换卷积实现,对于整个CNN,fbfft比cuFFT快1.5倍以上,并且对于许多普通的卷积层,速度也比NVIDIA的cuDNN实现 快(达到了一些合成内核配置的23.5倍)。