Oct, 2014

cuDNN:深度学习高效基元

TL;DR创建了一个类似于BLAS的优化深度学习工作负载例程库,包含GPU的程序,易于集成到现有框架中,性能优化和内存使用率提高36%。