MMSep, 2022

Tensor Cores 上高效的量化稀疏矩阵操作

TL;DR提出了 Magicube,这是一个适用于低精度整数的高性能稀疏矩阵库,支持深度学习中的两个主要稀疏操作(SpMM 和 SDDMM)在 Tensor Cores 上的混合精度加速,实验结果显示,相对于供应商优化库,Magicube 平均提高了 1.44 倍(最高提高到 2.37 倍),而且即使精度相当,相对于同类技术,性能也提高了 1.43 倍。