May, 2018

通道调节神经网络

TL;DR本研究介绍了通道门控(channel gating)方法,该方法是动态、细粒度且硬件高效的裁剪方案,能够通过跳过对分类结果没有贡献的输入通道的计算,优化卷积神经网络。实验证明,该方法能够在几乎不损失准确度的情况下,实现浮点运算量减少 2.7-8.0 倍,内存访问减少 2.0-4.4 倍,并结合知识蒸馏可以进一步降低计算成本。我们还设计了一个加速器,能够以 2.4 倍的速度进行量化的 ResNet-18 模型的推理,并实现了 2.8 倍的理论 FLOP 减少。