BriefGPT.xyz
大模型
Ask
alpha
关键词
numerical overflow
搜索结果 - 1
A2Q+: 提高累加器感知的权重量化
通过限制权重和激活函数的精度,量化技术通常降低神经网络推理成本。最近的研究表明,降低累加器的精度可以进一步提高硬件效率,但存在数值溢出的风险,这会导致算术错误并降低模型的准确性。为了避免数值溢出并保持准确性,最新的工作提出了一种称为累加器感
→
PDF
5 months ago
Prev
Next