Sep, 2024
CFSP:一种有效的结构化剪枝框架,利用粗到细的激活信息
CFSP: An Efficient Structured Pruning Framework for LLMs with
Coarse-to-Fine Activation Information
TL;DR本研究解决了大型语言模型(LLMs)在实际应用中的庞大参数和计算开销问题,提出了一种新颖的结构化剪枝框架CFSP。该方法通过粗粒度和细粒度激活信息作为重要性标准,提高了剪枝效率,仅需一次前向传播即可完成特征激活计算,并在各类稀疏预算下表现优于现有方法。