BriefGPT.xyz
Ask
alpha
关键词
magnitude attention
搜索结果 - 1
基于幅度注意力的动态剪枝
本文提出了一种新颖的动态裁剪方法,称之为基于数量级注意力的动态裁剪 (MAP) 方法,该方法在前向和反向路径中均运用了权重的重要性来动态探索稀疏模型结构,可以在更高效的情况下实现密集模型的性能,并且在 CIFAR-10/100 和 Imag
→
PDF
a year ago
Prev
Next