Oct, 2020

通过谱归一化身份先验对Transformer模型中的冗余映射进行修剪

TL;DR本文介绍了一种基于 SNIP 的结构化剪枝方法,通过对 Transformer 模型中的整个残差模块进行惩罚,识别并丢弃不重要的非线性映射,并引入谱归一化来稳定 Transformer 层的后激活值分布以进一步改善剪枝效果。实验结果表明,SNIP 在保持可比性能的同时实现了有效的剪枝结果,在 50% 的压缩比下将基准任务的性能提高了 0.5 到 1.0%。