BriefGPT.xyz
大模型
Ask
alpha
关键词
sparsity ratios
搜索结果 - 2
Compresso: 结构化剪枝与合作促使学习紧凑的大型语言模型
通过合作的剪枝算法和大型语言模型自身,在数据收集和训练成本昂贵的挑战下,Compresso 通过在训练过程中学习最优的剪枝决策以及引入协同提示进一步增强了剪枝算法,成功将 LLaMA-7B 剪枝至 5.4B,并在阅读理解上超过 LLaMA-
→
PDF
9 months ago
ICLR
随机剪枝的不合理有效性:最朴素的稀疏训练基线模型的回归
本研究探讨了如何在现代神经网络中使用稀疏训练,提出了初始化时的随机剪枝能够有效地提高神经网络的稀疏训练性能,结果表明此方法可以匹配对应的密集网络,达到了预期效果,并且进行适当的层级稀疏比率的选择,可以进一步提高性能。
PDF
2 years ago
Prev
Next