Sep, 2018

现代 CPU 上 FFT 卷积比 Winograd 更快,这是为什么

TL;DR比较了三种高度优化的实现方式(常规 FFT、Gauss-FFT 和 Winograd-based convolution)在现代多核和众核 CPU 上的效果,并使用 Roofline 性能模型对三种方法的计算阶段进行了详细的分析,结果显示 FFT-based 实现通常优于 Winograd-based approach。