Jun, 2020

改进后训练神经量化:逐层校准与整数规划

TL;DR本文研究使用后训练量化方法达到低于8位的精度损失和模型压缩,采用分层次优化参数和整数规划方案,性能在视觉和文本模型上最优。