Sep, 2023

通过准确度预测器修剪大型语言模型

TL;DR基于新的剪枝方法与准确度预测模型,本研究提出一种能够自动选择最佳模型的压缩方法,实验证明其有效性和高效性。相较于基准模型,Wikitext2 和 PTB 上的困惑度分别降低了 9.48% 和 5.76%,而平均 MMLU 准确度提高了 6.28%。