May, 2024

现代 LLM 的量化中异常值和校准集的影响逐渐减小

TL;DR通过减少内存使用和提高操作速度,后训练量化(PTQ)能够增强大型语言模型(LLMs)的效率和与更多硬件的兼容性,尽管会导致一定的性能下降。然而,我们的研究发现在不同已知的开源 LLMs 中,校准集对于评估激活幅度和检测异常值至关重要,异常值可能扭曲量化范围并对性能产生负面影响。因此,我们建议重新评估当前量化文献的基础知识,从主要关注异常值保留转向优化推断速度,以适应现代化 LLMs 的特性。