BriefGPT.xyz
大模型
Ask
alpha
关键词
dnn quantization
搜索结果 - 2
ICML
从学生中学习:应用 t - 分布来探索 LLM 的准确和高效格式
使用大规模分析,我们得出结论:大多数分布遵循 t 分布。由此,我们推导出基于该分布的新型格式 -- Student Float(SF4),其相较于 Normal Float(NF4)可提高现代大语言模型的平均准确率。接着,我们提出通过增加两
→
PDF
2 months ago
使用 8 位整数训练高性能和大规模深度神经网络
本文提出了一种名为 WAGEUBN 的统一完整量化框架,可将神经网络的数据路径(包括所有数据类型 W,A,G,E,U 和 BN)中所有数据转换为低位整数以实现全面量化和在线训练,并在 ImageNet 数据集上获得了可比较的精度,展示了在大
→
PDF
5 years ago
Prev
Next