ICMLSep, 2022
带有衰减剪枝掩码的 N:M 结构稀疏化训练配方
Training Recipe for N:M Structured Sparsity with Decaying Pruning Mask
Sheng-Chun Kao, Amir Yazdanbakhsh, Suvinay Subramanian, Shivani Agrawal, Utku Evci...
TL;DR本文研究 N:M 稀疏性训练的不同方法,并提出了两种新的基于衰减的修剪方法,即 “修剪掩码衰减” 和 “稀疏结构衰减”。研究表明,这些提出的方法在保持与非结构化稀疏性可比的模型精度同时,增加的总训练计算量(FLOPs)相对较小。