ICCVOct, 2021

RMSMP:一种具有逐行混合方案和多精度的新型深度神经网络量化框架

TL;DR本文提出了一种新颖的深度神经网络量化框架 ——RMSMP,采用行混合方案和多精度方法,在硬件推理中简化操作,同时保持准确性。通过对所有层进行线下确定量化方案,RMSMP 量化算法使用 Hessian 和基于方差的方法为每行分配精度和方案,并在 FPGA 设备上实现,与 4 位定点基线相比,在 ImageNet 上对 ResNet-18 的端到端推理时间实现了 3.65 倍加速。