Mar, 2023

基于固定点量化感知训练的设备端关键词检测

TL;DR本研究旨在提出一种新的 FXP 卷积关键词检测模型的训练方法,结合了两种量化感知训练技术 - 压缩权重分布和模型参数的绝对余弦正则化,同时还提出了针对瞬变变量的 QAT 技术,通过实验结果表明我们可以在不降低准确性的情况下将模型精度降低至 4 位,并且在推断阶段 FXP-QAT 消除了 Q 格式规范化并可以使用低比特累加器,同时利用最大内核 SIMD 减少用户感知延迟,降低了 68% 的执行时间。