ICMLSep, 2018

高性能零内存开销直接卷积

TL;DR本篇论文研究并证明了,当直接卷积实现正确时,消除了所有的内存开销,且效率在传统和嵌入式 CPU 架构上比现有的高性能卷积实现提高了 10% 到 400% 不等,并可以更好地扩展性能,即增加线程数时的性能下降更少。