BriefGPT.xyz
Ask
alpha
关键词
parameter magnitude
搜索结果 - 1
基于相关性和数量级的资源感知 DNN 剪枝
提出了一种名为 FlexRel 的新型修剪方法,通过结合训练时间和推理时间信息,即参数大小和相关性,来提高准确性,并节省计算资源和带宽。性能评估表明,FlexRel 能够实现更高的修剪因子,为典型准确性目标节省超过 35%的带宽。
PDF
2 months ago
Prev
Next