CVPRJan, 2022

视觉 Transformer 瘦身:连续优化空间中的多维度搜索

TL;DR本文介绍了一种名为 ViT-Slim 的视觉转换器压缩框架,基于可学习和统一的 l1 稀疏性约束搜索多个维度的子结构,通过预算阈值得到压缩后的模型,试验结果表明,ViT-Slim 可以在保持较高图像分类准确率的同时,将参数和 FLOP 压缩至 40%。