Feb, 2021

从头开始学习N:M细粒度结构稀疏神经网络

TL;DR本文研究了一种N:M级别的深度神经网络稀疏网络,在专门设计的GPU上同时具有非结构化细粒度稀疏性和结构化粗粒度稀疏性的优点,解决了传统稀疏网络的效率问题,同时提出了一种Sparse-refined Straight-through Estimator方法,解决了传统优化方法下的负面影响。