Sep, 2022

带有衰减剪枝掩码的N:M结构稀疏化训练配方

TL;DR本文研究N:M稀疏性训练的不同方法,并提出了两种新的基于衰减的修剪方法,即“修剪掩码衰减”和“稀疏结构衰减”。研究表明,这些提出的方法在保持与非结构化稀疏性可比的模型精度同时,增加的总训练计算量(FLOPs)相对较小。