ICLRJun, 2021

RegionViT: 基于区域到局部的视觉转换器注意力机制

TL;DR本文提出了一种采用金字塔结构和新的区域到局部注意力的视觉 transformer(ViT)架构,可以在图像分类和目标检测等四个任务上优于目前最先进的视觉 transformer(ViT)变体。