BriefGPT.xyz
Ask
alpha
关键词
sparse pruning
搜索结果 - 2
CVPR
利用 GPU 友好的稀疏化和量化增强视觉 Transformer
本文通过应用 2:4 结构稀疏化与量化方法,并在裁剪和量化进程中使用混合策略知识蒸馏,设计了一种压缩方案,可以在几乎无损精度降低的情况下将视觉变压器模型的大小减少 6.4-12.7 倍并提高实际部署性能。
PDF
a year ago
重构网络剪枝 -- 在预训练和微调范式下
本论文研究在 NLP 领域中,对预训练的 Transformers 模型采取稀疏剪枝 (sparse pruning) 技术,相较于对其通道与层数的压缩,稀疏剪枝的效果更为显著。通过基于 GLUE 数据集的实验比较,证明本论文所采用的知识感
→
PDF
3 years ago
Prev
Next