CVPRApr, 2022

MixFormer: 跨窗口与跨维度混合特征

TL;DR本论文提出了一种名为 MixFormer 的方法,将局部窗口自注意力与深度可分卷积相结合,跨窗口连接建模以扩大感受野,并在通道和空间维度上提供互补线索,从而实现更好的特征混合。在图像分类方面,MixFormer 相比于 RegNet 和 Swin Transformer 表现更好。在 MS COCO,ADE20k 和 LVIS 的 5 项密集预测任务中,其下游任务的性能也明显优于其他替代方案。