Mar, 2018

GPU 上的稀疏矩阵乘法设计原则

TL;DR本文提出了两种新算法以在 GPU 上实现稀疏矩阵与密集矩阵相乘,主要关注延迟隐藏、负载平衡和内存访问,实验分析表明该算法在处理实际数据集时获得了 4.1 倍的速度提升和 31.7%的平均速度提升。