Aug, 2024

PAT:大语言模型的剪枝感知调优

TL;DR本研究解决了大语言模型在内存和计算需求方面的挑战,提出了一种新颖的剪枝感知调优(PAT)方法,以在模型微调的同时进行结构剪枝,最大程度地保留模型性能。关键发现是,该方法通过引入混合稀疏化模块(HSM)实现了更高的效率与性能,实验表明与LoRA微调模型相比,显著提高了速度与准确性。