Sep, 2022

扩张邻域注意力变换器

TL;DR本文介绍了一种新型 Hierarchical Vision Transformer,Dilated Neighborhood Attention Transformer(DiNAT)及其基于 Dilated Neighborhood Attention(DiNA)的自注意力机制,使其具备全局关联建模和扩大感受野的能力,证明 DiNAT 对常规 Hierarchical Vision Transformer 具有显著的优势,从而实现了在一些特定领域中更好的 Panoptic 分割表现。