Jun, 2019

使用 Kronecker 乘积将 RNN 压缩 15-38 倍,用于 IoT 设备

TL;DR本文介绍了一种使用 Kronecker 乘积(KP)的方法来压缩适用于资源受限环境中的循环神经网络(RNN),KP 可以使 RNN 层的压缩率达到 15-38x,并且通过将其量化为 8 位可以进一步提高压缩因子至 50 倍,同时提高推断运行时间和任务准确度。作者提出了一种混合 KP(HKP)算法来解决由于压缩导致的准确度损失问题,并且可以通过添加少量的模型参数来控制压缩比,从而提高模型准确度。