Nov, 2023
大型语言模型的后训练修剪和量化受校准数据的影响
How Does Calibration Data Affect the Post-training Pruning and Quantization of Large Language Models?
Miles Williams, Nikolaos Aletras
TL;DR通过大型语言模型的模型压缩,剪枝和量化构成了神经网络模型压缩的基础,而本文首次对校准数据对 LLM 性能的影响进行了广泛的实证研究,并发现下游任务性能存在显著的变化,为 LLM 量化和剪枝的有效使用提供了一系列的建议。