BriefGPT.xyz
大模型
Ask
alpha
关键词
gpu inference
搜索结果 - 1
ICML
实用网络压缩的群组 Fisher 剪枝
本文提出了一种通道剪枝的方法,可以应用于各种复杂的结构,包括具有耦合通道的结构,在各种主干网络上进行了大量的实验,证明该方法可以有效地提高推断速度而不影响准确性。同时纳入了 GPU 推断速度关联性比 FLOPs 更高的记忆占用量的考量。
PDF
3 years ago
Prev
Next