Mar, 2024

FALCON: 面向神经网络剪枝的 FLOP 感知组合优化

TL;DR神经网络的计算需求逐渐增加,同时对资源有限的设备提出了部署挑战。网络剪枝是在保持性能的同时减小模型大小和计算成本的解决方案。本文提出了 FALCON,一种基于组合优化的网络剪枝框架,同时考虑了模型准确性、FLOPs 和稀疏性约束。我们的算法可以解决含有数百万参数的问题实例,并证明在固定 FLOP 预算下,FALCON 相比其他剪枝方法具有更高的准确性。此外,在逐步剪枝设置中,我们的框架表现优于现有的剪枝方法,强调了对有效网络剪枝而言,结合 FLOP 和稀疏性约束的重要性。