BriefGPT.xyz
大模型
Ask
alpha
关键词
limited hardware resources
搜索结果 - 2
CVPR
使用逐元素梯度缩放的网络量化
本文提出了一种新的基于 element-wise gradient scaling 的量化网络的训练方法,该方法可以更好地解决量化误差问题,提高在有限硬件资源情况下深度神经网络的稳定性和准确性。
PDF
3 years ago
神经网络的低位量化以提高推理效率
本文提出了一种在有限硬件资源上实现预训练模型的 4 位整数(INT4)量化的优化方法,将线性量化任务形式化为最小均方误差(MMSE)问题,并对网络的每一层进行限制 MSE 问题的优化以及多个量化张量的硬件感知分区,除少量精度降低外,在多种网
→
PDF
5 years ago
Prev
Next