May, 2020

运动剪枝:通过微调实现自适应稀疏性

TL;DR本文提出一种基于移动修剪的权重修剪方法,相比于纯监督学习中使用的幅度修剪方法,更适用于预训练模型微调,实验证明在高稀疏度下,此方法对预训练语言模型的剪枝效果更好,结合蒸馏技术最大程度地减小模型参数,同时保持模型准确率。