Jun, 2024

多维剪枝:带时延约束的通道、层和块剪枝

TL;DR提出了一种新的多维修剪框架,可以同时优化通道、层和块的修剪,并满足延迟约束,通过将修剪重新构建为混合整数非线性规划 (MINLP),能够高效地确定最佳修剪结构。该方法在大规模修剪比例下取得了显著的改进。