CVPRDec, 2022

FlexiViT:一模型多尺寸贴片处理

TL;DR本文介绍一种叫做 FlexiViT 的方法,能够动态改变 ViT 模型输入的 patch size 以适应不同的计算预算,从而提高计算效率和精度。通过实验发现,FlexiViT 训练的模型在分类、图像文本检索、分割等多个任务上表现良好,易于应用于大多数基于 ViT 结构的计算任务。