BriefGPT.xyz
Ask
alpha
关键词
fp8
搜索结果 - 2
FP8-BERT:Transformer 的后训练量化
本文通过对 GLUE 和 SQuAD v1.1 数据集上的 BERT 变种进行大量实验,验证了 FP8 作为一种进行后训练量化的有效方式,能够在不显著损失精度的情况下提高准确性。
PDF
7 months ago
FP8 量化:指数的力量
本研究深入探究了采用浮点数格式(FP8)进行神经网络量化的性能优势,分析了尾数和指数位数选择对性能的影响,并通过大量实验证明,相对于 INT8 格式,FP8 格式具有更高的精度和更优的性能。
PDF
2 years ago
Prev
Next