Oct, 2021

硬件感知延迟削减

TL;DR通过硬件感知延迟剪枝(HALP)将结构剪枝作为全局资源分配优化问题,同时控制延迟在预定义的预算下最大化准确性。 HALP 使用延迟查找表来跟踪延迟减少潜力,使用全局显着性得分来评估准确度降低,并可以在剪枝期间非常高效地评估这两个指标,使我们能够在目标约束下重构全局结构剪枝问题,从而通过我们的增强型背包求解器解决问题,从而使 HALP 在剪枝效果和准确性效率平衡方面超越以前的工作。