Nov, 2020

优化量化深度神经网络的微调:基于过滤的预剪枝方法

TL;DR该研究提出了一种减小深度神经网络(DNNs)体积的方法——使用低位表达来量化预训练模型的权重和激活数据,并提出了基于剪枝的新方法PfQ来解决深度中间层权重动态范围宽导致的量化误差和准确度下降的问题。