Dec, 2024
具有结构重要性意识的大型语言模型自适应剪枝
Adaptive Pruning for Large Language Models with Structural Importance
Awareness
TL;DR本研究解决了大型语言模型在资源受限边缘设备上部署困难的问题。提出了一种新的模型剪枝方法,具结构意识的自适应剪枝(SAAP),通过定义自适应重要性融合指标和模块排名来减少计算和内存成本,同时保持模型性能。实验结果表明,SAAP显著优于现有方法,提升了多个语言模型的准确性和生成速度,具有实际应用价值。