Aug, 2023

MRQ: 通过模型重新量化支持多种量化方案

TL;DR本文介绍了一种新型模型量化方法 MRQ(Model Re-quantization),可将现有的量化模型迅速转换以满足不同的量化需求,克服了重新训练的成本和支持多种量化方案的限制。通过权重校正和舍入误差折叠等新的重量化算法,MobileNetV2 QAT 模型可在不到 0.64 的准确度损失下快速重新量化为两种不同的量化方案,已成功部署在 Echo Show 设备的 NNA 中。