ICLRFeb, 2022

F8Net: 仅限定点 8 位乘法用于网络量化

TL;DRF8Net 是一种完全由固定点 8 位乘法构成的量化框架,可以降低神经网络量化模型与完全精度模型之间的性能差距,并显著降低内存占用和能源消耗。