Jan, 2022

BOAT: 双向局部注意力视觉 Transformer

TL;DR本文提出了一种新的局部自注意机制 BOAT,该机制在特征空间中对局部窗口中的补丁进行聚类,并在每个聚类中进行自我注意。将 BOAT 集成进 CSWin 模型,实验结果表明,BOAT-CSWin 模型在多个基准数据集上表现良好,明显优于现有的卷积神经网络模型和视觉 Transformer。