BriefGPT.xyz
Ask
alpha
关键词
block influence
搜索结果 - 1
ShortGPT: 大型语言模型中的层次关系比您预期的更冗余
大型语言模型的层之间存在高相似性,某些层对网络功能没有显著作用,因此提出了一种基于层重要性评分的剪枝方法,并且该方法在模型剪枝方面明显优于先前的最新方法,同时与量化等方法相互独立,能进一步减小参数和计算量。
PDF
4 months ago
Prev
Next