CVPRApr, 2022

ViTOL: 弱监督目标定位的视觉 Transformer

TL;DR我们提出了一种名为 ViTOL 的方法来处理弱监督目标定位问题,在自我关注和渐变关注实现的基础上,引入了基于补丁的关注中断层 (p-ADL) 用于增加定位图的覆盖范围,并且使用基于类别的注意力图生成机制来解决类不可知的问题,并在 ImageNet-1K 和 CUB 数据集上取得了 70.47% 和 73.17% 的最新结果。