May, 2024

SPP:稀疏保存的参数高效微调大型语言模型

TL;DR介绍了一种基于稀疏保持参数高效微调的方法,通过轻量级可学习的列和行矩阵对稀疏大语言模型的权重进行优化,保持修剪过的预训练模型的结构和稀疏性,显著提升了稀疏大语言模型的性能。