Markus Nagel, Mart van Baalen, Tijmen Blankevoort, Max Welling
TL;DR介绍了一种数据自由的量化深度神经网络方法,采用固定 8 位定点量化的方式来提高计算效率,并且通过处理激活函数中的比例等变性和纠正误差偏差来提高性能和准确度,可应用于常见的计算机视觉架构和任务中,以 API 调用的形式提高量化模型的性能和表现。
Abstract
We introduce a data-free quantization method for deep neural networks that does not require fine-tuning or hyperparameter selection. It achieves near-original model →