BriefGPT.xyz
Ask
alpha
关键词
sharpness-aware quantization
搜索结果 - 3
激活稀疏量化深度神经网络中的存储错误:基于锐度感知训练的分析和缓解
提高深度神经网络(DNN)加速器的硬件效率,例如采用量化和稀疏增强技术,显示了巨大的潜力。然而,在非理想的现实环境(例如存在硬件故障)中,它们的推理准确性尚未被系统地分析。本文研究了存储器故障对激活稀疏量化 DNN(AS QDNN)的影响,
→
PDF
21 days ago
EMNLP
零炮灰锐度感知量化预训练语言模型
我们提出了一种新颖的零射频锐化感知量化(ZSAQ)框架,用于各种预训练语言模型的零射频量化,并理论证明了 SAM-SGA 优化算法的收敛速度以及该结果适用于其他非凸型极小 - 极大优化框架。通过在 11 个任务上进行大量实验证明,我们的方法
→
PDF
9 months ago
面向深度神经网络的锐度感知量化
本研究提出了一种新方法,叫做 sharpness-aware quantization,旨在通过减小量化时的抖动来提高网络压缩的泛化性能,此方法在多组实验中均能取得比当前最先进方法更好的结果。
PDF
3 years ago
Prev
Next