Feb, 2024

基于顺序注意力的块稀疏化:可微剪枝结合组合优化

TL;DR神经网络剪枝是一种重要的技术,能够构建大规模且可扩展、可解释和可推广模型。本文提出了一个结构化神经网络剪枝的方法,将可微剪枝指导组合优化算法选择最重要的稀疏参数集,从而在 ImageNet 和 Criteo 数据集上取得了大规模神经网络块级剪枝任务的最新成果。