Feb, 2024
基于顺序注意力的块稀疏化: 可微剪枝结合组合优化
SequentialAttention++ for Block Sparsification: Differentiable Pruning
Meets Combinatorial Optimization
TL;DR神经网络剪枝是一种重要的技术,能够构建大规模且可扩展、可解释和可推广模型。本文提出了一个结构化神经网络剪枝的方法,将可微剪枝指导组合优化算法选择最重要的稀疏参数集,从而在ImageNet和Criteo数据集上取得了大规模神经网络块级剪枝任务的最新成果。