Mar, 2022

Transformer 模型的快速后训练剪枝框架

TL;DR本文提出一种基于结构化稀疏方法的快速 Transformer 模型剪枝框架,无需重新训练即可保持高准确度,在 GLUE 和 SQuAD 数据集中分别实现了 2 倍的 FLOPs 减少和 1.56 倍的推理速度提升,在单个 GPU 上不到 3 分钟即可完成模型修剪。