Mar, 2021

高效神经网络推理量化方法综述

TL;DR本文旨在综述深度神经网络计算中数值量化的方法和优缺点,囊括了使用固定整数值的优点、及降低 4x 到 8x 等现实应用中的实际结果,以及占用更少的内存和降低延迟的潜力。