CVPRJan, 2022
视觉 Transformer 瘦身:连续优化空间中的多维度搜索
Vision Transformer Slimming: Multi-Dimension Searching in Continuous Optimization Space
Arnav Chavan, Zhiqiang Shen, Zhuang Liu, Zechun Liu, Kwang-Ting Cheng...
TL;DR本文介绍了一种名为 ViT-Slim 的视觉转换器压缩框架,基于可学习和统一的 l1 稀疏性约束搜索多个维度的子结构,通过预算阈值得到压缩后的模型,试验结果表明,ViT-Slim 可以在保持较高图像分类准确率的同时,将参数和 FLOP 压缩至 40%。