AAAIMar, 2022

CF-ViT: 一种通用的视觉 Transformer 粗细递进方法

TL;DR本文提出了一种粗到细的 CF-ViT,实现视觉图像的快速识别,具有较高的计算效率,可以支持小长度的词条序列,大大减少了计算成本。