May, 2022

具有循环移位窗口关注力的Transformer跟踪

TL;DR本文提出了一种新的transformer模型结构用于视觉目标跟踪,该模型引入了多尺度循环平移窗口机制使得跟踪注意力可以由像素级别提升到窗口级别,这种跨窗口的多尺度注意力有利于聚合不同尺度的注意力,同时采用的循环平移策略通过添加位置信息扩展窗口以提高跟踪准确度,并且减少了冗余计算,最后的实验表明这种方法取得了最先进的性能表现,并刷新了五个数据集的最佳记录。