May, 2018

卷积神经网络压缩在自然语言处理中的应用

TL;DR本文提出了一种对情感分析中高效的卷积神经网络进行压缩的方法,该方法包含量化和修剪过程,并展示了将压缩后的网络映射到 FPGA 的方法及其实现结果,实验表明实现 5 位宽度即可达到与浮点数相近的精度且达到了较大的内存占用空间减少(从 85% 到 93%)。