May, 2023

利用GPU友好的稀疏化和量化增强视觉Transformer

TL;DR本文通过应用2:4结构稀疏化与量化方法,并在裁剪和量化进程中使用混合策略知识蒸馏,设计了一种压缩方案,可以在几乎无损精度降低的情况下将视觉变压器模型的大小减少6.4-12.7倍并提高实际部署性能。