BriefGPT.xyz
大模型
Ask
alpha
关键词
fixed-point 8-bit multiplication
搜索结果 - 1
ICLR
F8Net: 仅限定点 8 位乘法用于网络量化
F8Net 是一种完全由固定点 8 位乘法构成的量化框架,可以降低神经网络量化模型与完全精度模型之间的性能差距,并显著降低内存占用和能源消耗。
PDF
2 years ago
Prev
Next