BriefGPT.xyz
大模型
Ask
alpha
关键词
salience-driven mixed-precision quantization
搜索结果 - 1
SliM-LLM:面向大型语言模型的显著性驱动混合精度量化
本文提出了一种基于显著性驱动的混合精度量化方案,即 SliM-LLM,用于改进大型语言模型的精度和内存占用,并通过集成梯度量化器进一步减少困惑度。
PDF
a month ago
Prev
Next