BriefGPT.xyz
大模型
Ask
alpha
关键词
gptq
搜索结果 - 2
CDQuant: 使用贪婪协调下降的准确大型预训练模型的训练后权重量化
CDQuant 是一个简单且可扩展的替代 GPTQ 的算法,使用坐标下降法来实现高质量的量化权重,通过在 PaLM2 模型系列上进行广泛评估,我们证明 CDQuant 在各种模型规模和量化级别下始终优于 GPTQ。
PDF
9 days ago
基于梯度的训练后量化:对现状的挑战
量化方法在深度神经网络的高效部署中变得至关重要,深度神经网络经常需要量化以便在计算中使用固定点操作代替浮点操作。本文探讨了一种基于梯度的后训练量化方法(GPTQ),证明了该方法在选择权重、特征增强、校准集等方面具有一定鲁棒性,并提出了设计更
→
PDF
a year ago
Prev
Next