CVPRMar, 2022

语义对齐融合 transformer 用于一阶段物体检测

TL;DR研究了在数据稀缺的情况下,单次目标检测的问题,提出了一个效果良好的基于注意力机制的框架,名为 Semantic-aligned Fusion Transformer (SaFT),采用竖直和水平融合模块实现跨尺度和跨样本特征的融合,通过语义对齐的注意力机制大幅提高性能,使得基于目前现有的数据训练的一阶段的检测基线的性能得到了显著提升。