CVPRDec, 2022

ResFormer:多尺度训练下的 ViT 模型缩放

TL;DRResFormer 框架通过多分辨率训练方法和全局 - 局部位置嵌入策略,在图像分类、目标检测、语义分割和视频动作识别等领域取得了较好的结果。