Oct, 2017

深度神经网络模型压缩与加速综述

TL;DR本文对深度神经网络模型压缩和加速的最新技术进行了回顾,介绍了参数修剪、量化、转移/紧凑卷积滤镜和知识蒸馏等四类技术及其表现、应用、优点和缺点,同时探讨了评估矩阵、评估模型表现所使用的主要数据集和最近的基准努力,并讨论了面临的挑战和未来方向。