Apr, 2024

SCAResNet:一种针对传输和配电塔微小物体检测经过优化的 ResNet 改进版本

TL;DR传统的基于深度学习的目标检测网络通常会在数据预处理阶段调整图像大小,以实现特征图的统一大小和比例。然而,调整大小不可避免地导致对象变形并丢失图像中的有价值信息。为了解决这个问题,我们提出了一种放弃调整大小操作的方法,而是引入了位置编码多头交叉注意力。这使得模型能够捕捉上下文信息并从多个表示子空间中学习,有效丰富了配电塔的语义。此外,我们还通过将三个池化特征图重塑为一个新的统一特征图来增强空间金字塔池化,同时减少计算负担。我们的 SCAResNet 将这些改进整合到了 ResNet 骨干网络中。我们使用了 Duke 大学的电力传输和配电基础设施图像数据集对 SCAResNet 进行了评估。在不使用任何其他技巧的情况下,我们将各种目标检测模型与以高斯感受野为基础的标签分配作为基准。将 SCAResNet 引入基准模型后,我们在 mAP 上实现了 2.1% 的改善。这证明了我们的 SCAResNet 在检测传输和配电塔方面的优势,并体现了其在小型目标检测中的价值。源代码可在此 URL 获取。