May, 2023

结构稀疏动态稀疏训练

TL;DR本研究提出了一种基于 DST 方法的 N:M 结构稀疏化学习方案,其具有较高的稀疏度并支持常见的硬件加速方式,在理论和实践中都表现出较好的泛化性能与较低的推理时间。