BriefGPT.xyz
Ask
alpha
关键词
structured sparsity methods
搜索结果 - 1
Transformer 模型的快速后训练剪枝框架
本文提出一种基于结构化稀疏方法的快速 Transformer 模型剪枝框架,无需重新训练即可保持高准确度,在 GLUE 和 SQuAD 数据集中分别实现了 2 倍的 FLOPs 减少和 1.56 倍的推理速度提升,在单个 GPU 上不到 3
→
PDF
2 years ago
Prev
Next