May, 2024

基于相关性和数量级的资源感知 DNN 剪枝

TL;DR提出了一种名为 FlexRel 的新型修剪方法,通过结合训练时间和推理时间信息,即参数大小和相关性,来提高准确性,并节省计算资源和带宽。性能评估表明,FlexRel 能够实现更高的修剪因子,为典型准确性目标节省超过 35%的带宽。