ACLMay, 2023

使用原则重要性和自我正则化剪枝预训练语言模型

TL;DR本研究提出了一种基于等式约束的 0-1 整数线性规划问题和自我正则化机制的迭代模型修剪方法,应用于各种基于 Transformer 的 PLMs,使得在高稀疏度时具有更好的泛化性能。