Jun, 2022

8 位神经网络加速器的小于 8 位量化感知训练,用于设备上的语音识别

TL;DR本文提出了一种 8 位神经网络加速器的新型子 8 位量化感知训练(S8BQAT)方案,利用 Lloyd-Max 压缩理论的灵感,通过适当的实用化来降低计算开销,并应用于递归神经网络传输者 (RNN-T) 结构的语音识别任务中,进一步优化模型参数大小,相对减少误差率 4%-16%,提高计算速度 5%。