Aug, 2020
SparseRT: 基于GPU加速的深度学习推断非结构化稀疏矩阵运算
SparseRT: Accelerating Unstructured Sparsity on GPUs for Deep Learning
Inference
TL;DR本文介绍了一种基于 unstructured sparsity 的 code generator - SparseRT,通过对于1x1 convolutions 以及 fully connected layers 进行计算,该方法相对于 equivalent dense computation 速度提升了 3.4x 至 5.4x,同时处理 ResNet-50 的 sparse 3x3 convolutions 取得了 5x 的速度提升,能够有效地加速 GPU 上的深度学习操作。