Jan, 2021

基于 Hessian 的剪枝和最优神经植入

TL;DR本文章提出了一种新的基于 Hessian Aware Pruning 和神经植入的方法来减小神经网络模型的内存占用和浮点运算数,该方法利用二阶灵敏度作为结构化剪枝的度量标准,测试结果表明,在计算机视觉任务和自然语言处理任务中,即使 70% 的参数剪枝,模型的精度也能够在 0.1%/0.5% 以内的误差范围内,而且在头部剪枝方面效果也显著。