Aug, 2022

FP8 量化:指数的力量

TL;DR本研究深入探究了采用浮点数格式(FP8)进行神经网络量化的性能优势,分析了尾数和指数位数选择对性能的影响,并通过大量实验证明,相对于 INT8 格式,FP8 格式具有更高的精度和更优的性能。