Nov, 2016

多核上的深层张量卷积

TL;DR通过扩展和优化快速Winograd级卷积算法,我们在CPU硬件上最大化CPU利用率及多核可伸缩性,处理了视频和体积图像分析中的空时特征,并证明了与之前的最先进技术相比,吞吐量提高了5到25倍。