BriefGPT.xyz
Ask
alpha
关键词
low-bit training
搜索结果 - 2
DenseShift:面向准确和可迁移的低比特移位网络
提出了一种名为 DenseShift 的神经网络,在低比特训练和转移学习方面具有优越的性能,通过零 - free 位移机制,新的度量标准和随机初始化策略,有效地简化了推理并提高了模型容量。
PDF
2 years ago
面向卷积神经网络的统一 INT8 训练
本文提出了一个统一的 INT8 训练框架,基于四个梯度特征和两个稳定性原则,以及两种普适性技术,包括方向敏感梯度裁剪和偏移抵消学习率缩放,可以支持各种网络和任务,并在不使用太多优化方法的情况下将训练时间降低了 22%。
PDF
5 years ago
Prev
Next