May, 2023

使用有效接受字段理解视觉变换器的高斯注意偏差

TL;DR本研究提出了一种使用高斯注意偏差来指导位置嵌入的方法,以提高视觉转换器(ViTs)在图像分类、目标检测和语义分割等任务中的性能。研究表明,使用这种方法不仅有助于 ViT 理解图像,还提高了在各种数据集上的性能。