BriefGPT.xyz
大模型
Ask
alpha
关键词
gradient-based language model pruner
搜索结果 - 1
超越大小:梯度如何塑造大型语言模型的剪枝决策
预训练的大型语言模型的梯度为基础的模型修剪器(GBLM-Pruner)通过利用卡尔曼几何中的几何相互关联性明显胜过其他竞争对手,并在各种语言评估中超过了幅度修剪、Wanda 和 SparseGPT。
PDF
8 months ago
Prev
Next