Aug, 2020

通过划分稀疏矩阵块提高无硬件支持的稀疏DNN模型加速

TL;DR本文提出了一种算法-软件共同设计的剪枝方法,采用“分块友好”的稀疏模式来实现现有的密集结构上的延迟加速,旨在解决原先稀疏模型上由于随机分布权重导致计算不规则的问题,在GPU笔记本上成功地实现了1.95倍速度提升的优化效果。