Mar, 2024
计算机视觉任务中的块/输出通道剪枝的分离,动态和可微 (SMART) 剪枝器
Separate, Dynamic and Differentiable (SMART) Pruner for Block/Output
Channel Pruning on Computer Vision Tasks
TL;DR深度神经网络剪枝是减少模型大小、提高推理延迟和降低深度神经网络加速器功耗的一种关键策略。我们介绍了一种新型的、独立且可微的剪枝方法(SMART pruner),它通过利用独立的、可学习的概率掩码来排名权重重要性,采用可微分的前k个操作符实现目标稀疏性,并利用动态温度参数技巧逃离非稀疏局部最小值。实验证明,SMART pruner在各种任务、模型和剪枝类型上始终表现出优于现有剪枝方法的优越性。此外,在N:M剪枝情况下,我们还针对基于Transformer的模型进行了测试,SMART pruner也取得了最先进的结果,展示了它在各种神经网络架构和剪枝类型上的适应性和鲁棒性。