May, 2024

通过改进内容查询和相似查询聚合提升 DETR 变体性能

TL;DR本文介绍了一种自适应内容查询模块(SACQ),它利用变换器编码器的特征通过自注意力池化生成内容查询,解决了传统零初始化或可学习嵌入的内容查询缺乏信息导致性能不佳的问题。为了应对增强的集中力对匈牙利匹配训练过程的挑战,我们提出了查询聚合策略,合并来自不同查询的类似预测候选项,从而简化优化过程。在 COCO 数据集上的广泛实验证明了我们所提方法的有效性,在多种配置下对六种 DETR 变体均取得了超过 1.0 AP 的平均改进。