BriefGPT.xyz
大模型
Ask
alpha
关键词
unstructured weight sparsity
搜索结果 - 1
A2Q: 累加器感知量化与溢出保护
我们提出了一种适用于训练量化神经网络(QNNs)以避免在推断过程中使用低精度累加器时的溢出问题的新颖的权重量化方法 ——accumulator-aware quantization(A2Q)。A2Q 引入了一种受权重归一化启发的独特公式,根
→
PDF
10 months ago
Prev
Next