Sep, 2020

利用 GPU 张量核加速稀疏矩阵 - 矩阵乘法

TL;DR通过将稀疏矩形块进行分割,利用 Tensor Core Units(TCUs)的混合精度模式实现的稀疏矩阵乘法算法 tSparse,可以显著比常用的 cuSPARSE、CUSP、RMerge2、Nsparse、AC-SpGEMM 和 spECK 的方法提高性能。