关键词structured pruning algorithms
搜索结果 - 2
- 无需重新训练的预训练语言模型知识保留剪枝
提出了一种名为 K-pruning (Knowledge-preserving pruning) 的准确的无需重新训练的结构化修剪算法,用于预训练的语言模型压缩,并在 SQuAD 基准测试中展示了比现有的无需重新训练的修剪算法高达 58.0 - ICLR重新思考网络剪枝的价值
本研究发现,在针对低资源设置中减少深度模型推理成本的网络修剪过程中,训练大模型通常不是获得高效终端模型的必要条件,学到的 “重要” 权重通常对小模型没有用,修剪的架构本身比继承的 “重要” 权重更重要,并且此方法可作为架构搜索范式。本文还比