Dec, 2024
SlimGPT:大型语言模型的分层结构剪枝
SlimGPT: Layer-wise Structured Pruning for Large Language Models
TL;DR本研究针对大型语言模型(LLMs)在实际应用中因参数规模庞大而面临的结构剪枝性能恢复难题,提出了一种低成本、高效的分层结构剪枝方法SlimGPT。该方法通过批量贪婪剪枝和增量剪枝比率,实现了快速近似最优的剪枝效果,实验结果表明,SlimGPT在LLaMA基准测试中表现优于其他方法,达到了当前最先进的水平。