May, 2024

SliM-LLM:面向大型语言模型的显著性驱动混合精度量化

TL;DR本文提出了一种基于显著性驱动的混合精度量化方案,即 SliM-LLM,用于改进大型语言模型的精度和内存占用,并通过集成梯度量化器进一步减少困惑度。