Jun, 2024
多维剪枝:带时延约束的通道、层和块剪枝
Multi-Dimensional Pruning: Joint Channel, Layer and Block Pruning with Latency Constraint
Xinglong Sun, Barath Lakshmanan, Maying Shen, Shiyi Lan, Jingde Chen...
TL;DR提出了一种新的多维修剪框架,可以同时优化通道、层和块的修剪,并满足延迟约束,通过将修剪重新构建为混合整数非线性规划 (MINLP),能够高效地确定最佳修剪结构。该方法在大规模修剪比例下取得了显著的改进。