ICLRFeb, 2021

从头开始学习 N:M 细粒度结构稀疏神经网络

TL;DR本文研究了一种 N:M 级别的深度神经网络稀疏网络,在专门设计的 GPU 上同时具有非结构化细粒度稀疏性和结构化粗粒度稀疏性的优点,解决了传统稀疏网络的效率问题,同时提出了一种 Sparse-refined Straight-through Estimator 方法,解决了传统优化方法下的负面影响。