May, 2024
基于相关性和数量级的资源感知 DNN 剪枝
Combining Relevance and Magnitude for Resource-Aware DNN Pruning
Carla Fabiana Chiasserini, Francesco Malandrino, Nuria Molner, Zhiqiang Zhao
TL;DR提出了一种名为 FlexRel 的新型修剪方法,通过结合训练时间和推理时间信息,即参数大小和相关性,来提高准确性,并节省计算资源和带宽。性能评估表明,FlexRel 能够实现更高的修剪因子,为典型准确性目标节省超过 35%的带宽。