BriefGPT.xyz
Ask
alpha
关键词
model-compression
搜索结果 - 1
基于 SVD 的加权剪枝提升上下文学习性能:理论视角
基于 Transfomer 的预训练大型语言模型(LLM)展示了令人惊叹的上下文学习能力(ICL)。在本文中,我们展示了基于 SVD 的权重剪枝可以增强 ICL 性能的有趣现象,并且在深层剪枝权重通常导致浅层性能的更稳定的改善。然而,这些发
→
PDF
a month ago
Prev
Next