Aug, 2020

SparseRT: 基于 GPU 加速的深度学习推断非结构化稀疏矩阵运算

TL;DR本文介绍了一种基于 unstructured sparsity 的 code generator - SparseRT,通过对于 1x1 convolutions 以及 fully connected layers 进行计算,该方法相对于 equivalent dense computation 速度提升了 3.4x 至 5.4x,同时处理 ResNet-50 的 sparse 3x3 convolutions 取得了 5x 的速度提升,能够有效地加速 GPU 上的深度学习操作。