Sep, 2022

基于二次幂量化的神经网络能效硬件加速

TL;DR通过使用二次幂量化和基于位移乘累加运算代替传统的乘累加运算,以及基于对数量化的新型剪枝方法,本文在基于 Zynq UltraScale + MPSoC ZCU104 SoC FPGA 的硬件神经网络加速器中实现了 Power-of-Two( PoT ) 权重,实现了至少 $1.4x$ 的能效提升。