ICMLSep, 2022

带有衰减剪枝掩码的 N:M 结构稀疏化训练配方

TL;DR本文研究 N:M 稀疏性训练的不同方法,并提出了两种新的基于衰减的修剪方法,即 “修剪掩码衰减” 和 “稀疏结构衰减”。研究表明,这些提出的方法在保持与非结构化稀疏性可比的模型精度同时,增加的总训练计算量(FLOPs)相对较小。