BriefGPT.xyz
大模型
Ask
alpha
关键词
adaptive channel reassembly technique
搜索结果 - 1
QLLM:用于大型语言模型的准确高效低比特量化
通过自适应通道重组技术,QLLM 提出了一种准确高效的低精度模型量化方法,实现了对大规模语言模型的低精度量化,并在 LLaMA-2 上相较于之前最先进的方法提高了 7.89% 的平均准确率。
PDF
9 months ago
Prev
Next