BriefGPT.xyz
大模型
Ask
alpha
关键词
mixed-precision quantization
搜索结果 - 24
ECCV
一个比特宽度统治全球
本论文通过对模型宽度乘数的使用,研究了深度卷积神经网络中权重量化的最佳位宽选择,发现使用单一位宽比混合精度量化对模型压缩更优。
PDF
4 years ago
通道维度 Hessian 感知迹加权量化神经网络
通过使用通道数量更少的针对 Hessian 迹的量化方法,结合使用基于深度强化学习的代理寻找最佳量化位和通道分配的方法,可以获得更好的结果。
PDF
4 years ago
CVPR
ZeroQ:一种新颖的零样本量化框架
本文提出了一种名为 ZeroQ 的新型零 - shot 量化框架,用于量化神经网络而无需访问原始数据,ZeroQ 通过优化一个与网络不同层的批量归一化统计数据相匹配的 Distilled Dataset 来实现。我们在不同的模型上进行了广泛
→
PDF
5 years ago
NIPS
深度神经网络压缩的可微细粒度量化
本文提出了一种基于梯度下降优化的深度神经网络压缩的精细化量化方法,通过在不同结构、层次上采用不同的精度,达到更好的压缩比和准确率的平衡。实验结果表明,与传统量化方法相比,该方法在相同压缩率下表现更优。
PDF
6 years ago
Prev
Next