Jul, 2021

CBNet: 一种用于目标检测的复合主干网络架构

TL;DR本文提出 CBNetV2,一个新颖灵活的骨干网络框架,通过在现有开源预训练骨干网络的预训练微调范式下构建高性能检测器,实现多个相同骨干网络的组合、高级别和低级别特征融合及逐渐扩展感受野以更高效地执行目标检测。本文提出的训练策略为 CBNet 检测器提供了更好的辅助监督,在不额外预训练复合骨干的情况下,CBNetV2 可用于各种骨干网络(基于 CNN 还是基于 Transformer)和大多数主流检测器的 head designs(单阶段 vs. 两阶段、锚点基 vs. 无锚点基)。实验结果表明,与简单地增加网络深度和宽度相比,CBNetV2 引入了一种更高效、有效且资源友好的方法来构建高性能骨干网络。尤其是,我们的 Dual-Swin-L 在单模型和单尺度测试协议下在 COCO test-dev 上实现了 59.4%的 box AP 和 51.6%的 mask AP,比 Swin-L 达到的最新成果(57.7%的 box AP 和 50.2%的 mask AP)显著更好,同时训练时间表被缩短了 6 倍。通过多尺度测试,我们将当前最佳单模型结果推向了 60.1%的 box AP 和 52.3%的 mask AP,而无需使用额外的训练数据。