Nov, 2023

大型语言模型的后训练修剪和量化受校准数据的影响

TL;DR通过大型语言模型的模型压缩,剪枝和量化构成了神经网络模型压缩的基础,而本文首次对校准数据对 LLM 性能的影响进行了广泛的实证研究,并发现下游任务性能存在显著的变化,为 LLM 量化和剪枝的有效使用提供了一系列的建议。