Oct, 2023

突破确定性障碍:随机修剪掩码的生成和选择

TL;DR在同等模型大小约束下,大而稀疏的模型普遍比小而密集的模型具有更高的准确性。因此,本文提出了一种模型修剪策略,首先以设计的随机方式生成多个修剪掩码,然后通过一个有效的掩码选择规则从候选掩码组中选择最优掩码。为了进一步提高效率,引入了一种早期掩码评估策略,减少了训练多个掩码的开销。在 GLUE 数据集的八个数据集上进行了广泛的实验证明,该方法在高稀疏水平下实现了最先进的性能。