Oct, 2024
DISP-LLM:无维度结构剪枝的大型语言模型
DISP-LLM: Dimension-Independent Structural Pruning for Large Language
Models
TL;DR该研究针对大型语言模型在资源有限设备上部署所面临的高内存和计算成本问题,提出了一种新的无维度结构剪枝方法。此方法通过消除嵌入维度的结构依赖,提升了模型的灵活性,并在多种大型语言模型上的实验结果表明,其性能优于现有的最先进技术,验证了结构剪枝可以达到与半结构剪枝相似的准确率。