Oct, 2022

GMP*:精心调整的逐步量化剪枝可优于绝大多数 BERT 剪枝方法

TL;DR本文重新考察了经典的逐渐减少幅度修剪(GMP)算法在大型语言模型,特别是 BERT 基准测试上的表现,发现一个简单通用的变量 GMP * 可以与更复杂的最新方法匹配或甚至超过其表现,结果为未来工作提供了简单但强大的基线。