SCAResNet：一种针对传输和配电塔微小物体检测经过优化的 ResNet 改进版本

Apr, 2024

SCAResNet：一种针对传输和配电塔微小物体检测经过优化的 ResNet 改进版本

SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers

Weile Li, Muqing Shi, Zhonghua Hong

TL;DR传统的基于深度学习的目标检测网络通常会在数据预处理阶段调整图像大小，以实现特征图的统一大小和比例。然而，调整大小不可避免地导致对象变形并丢失图像中的有价值信息。为了解决这个问题，我们提出了一种放弃调整大小操作的方法，而是引入了位置编码多头交叉注意力。这使得模型能够捕捉上下文信息并从多个表示子空间中学习，有效丰富了配电塔的语义。此外，我们还通过将三个池化特征图重塑为一个新的统一特征图来增强空间金字塔池化，同时减少计算负担。我们的 SCAResNet 将这些改进整合到了 ResNet 骨干网络中。我们使用了 Duke 大学的电力传输和配电基础设施图像数据集对 SCAResNet 进行了评估。在不使用任何其他技巧的情况下，我们将各种目标检测模型与以高斯感受野为基础的标签分配作为基准。将 SCAResNet 引入基准模型后，我们在 mAP 上实现了 2.1% 的改善。这证明了我们的 SCAResNet 在检测传输和配电塔方面的优势，并体现了其在小型目标检测中的价值。源代码可在此 URL 获取。

Abstract

Traditional deep learning-based object detection networks often resize images during the data preprocessing stage to achieve a uniform size and scale in the feature map. Resizing is done to facilitate model propagation and fully connected classification. However, resizing inevitably le

deep learning-based object detection networks positional-encoding multi-head criss-cross attention spatial pyramid pooling scaresnet tiny object detection

发现论文，激发创造

适应尺度的三叉戟网络在目标检测中的应用

本次研究旨在解决目标检测中的比例变化问题，提出了 Trident Network，利用控制实验研究感受野对于比例变化的影响，构建并训练出一个多分支并行架构，每个枝干共享相同的转换参数但具有不同的感受野，通过采样适当比例的对象实例进行专业化训练，其在 COCO 数据集上取得了 48.4 mAP 的最优表现。

Jan, 2019

SpineNet：学习尺度置换骨干网络以进行识别和定位

本文提出了 SpineNet，这是一个具有尺度置换中间特征和跨尺度连接的主干网络，在神经架构搜索的目标检测任务中学习。它在各种尺度上使用类似的构建块进行建模，而使用的 FLOPs 较少。在各种检测器上，SpineNet-190 单模型获得了远高于之前检测器的 52.5% AP 结果，并且转移能力良好，在分类任务中表现出色，相较之前还获得了 5% 的上升。

Dec, 2019

散射变换的缩放：深度混合网络

使用散射网络作为监督式混合深度网络的头几层的一般和固定初始化，结合局部编码可以达到与 CNNs 竞争的最佳结果，还可以在小样本情况下通过几何先验获得更好性能。

Mar, 2017

目标检测的简单训练策略和模型扩展

本文研究物体检测系统的速度和准确率损失函数，并通过改进模型架构、训练技术等方法，将模型的准确率提升了 7.7％，速度提升了 30％。作者继续提出了简单的缩放策略来探索速度和准确性之间的权衡，产生了两个 Pareto 曲线。最后，作者显示出 ResNet 架构在检测和实例分割系统中的性能要优于 EfficientNet。

Jun, 2021

自校准高效变换器（Self-Calibrated Efficient Transformer）用于轻量级超分辨率（Lightweight Super-Resolution）

本文提出使用深度学习的自校准高效变换器 (SCET) 网络，通过采用像素关注机制来提取图像特征，并使用高效变换器来获取相似的长距离特征，以恢复足够的纹理细节，该方法在不同环境下获得更为出色的性能。

Apr, 2022

NETNet: 邻居擦除与转移网络用于更好的单次检测

为了解决单次检测算法在目标尺度变化时的失效问题，本文提出一种名为 Neighbor Erasing and Transferring (NET) 的机制，实现对尺度感知特征的生成，同时借助该方法，构建了一种名为 NETNet 的单次检测网络，能够在保持实时性的前提下，取得更高的检测精度。

Jan, 2020

Res2Net：一种新的多尺度骨干网络结构

本文提出了一种新型卷积神经网络模块 ——Res2Net，在单个残差块内构建分层残差连接，从而以粒度的方式表示多尺度特征，并扩大每个网络层的感受野范围。在图像分类和目标检测等计算机视觉任务中，Res2Net 优于目前的基线方法。

Apr, 2019

SCSC：强化卷积神经网络和 Transformer 的空间跨尺度卷积模块

本论文介绍了一个名为空间跨尺度卷积（SCSC）的模块，通过验证其在改善 CNN 和 Transformers 方面的有效性。SCSC 引入了一种高效的空间跨尺度编码器和空间嵌入模块，以在一个层次中捕捉各种特征。通过在人脸识别任务中使用 SCSC 的 FaceResNet，在 68% 的 FLOPs 和 79% 的参数减少情况下，提高了 2.7% 的性能；在 ImageNet 分类任务中，使用 SCSC 的 Swin Transformer 在 22% 的 FLOPs 减少情况下实现了更好的性能，并且使用 SCSC 嵌入的传统网络（如 ResNet）可以与 Swin Transformer 的性能匹敌。

Aug, 2023

基于区域全卷积网络的物体检测

本论文涉及基于区域的检测器，使用卷积网络实现高效的物体检测，使用位置敏感的得分图解决分类中的平移不变性和物体检测中的平移可变性的问题，可自然地采用全卷积图像分类器骨干网进行物体检测，以 101 层残差网络 (ResNet) 在 PASCAL VOC 数据集上取得 83.6% mAP 的竞争性结果，测试时间为每张图像 170ms，比 Faster R-CNN 快 2.5-20 倍。

May, 2016

SCRDet: 面向小型、混杂和旋转目标的更为强健的检测

本文提出一种新颖的旋转多分类目标检测器 SCRDet，旨在解决小目标、杂乱目标和旋转目标检测的问题。并通过使用采样融合网络，以及监督像素注意力网络和通道注意力网络，来提高对小目标的灵敏度和准确度。实验结果显示该检测器在各类公共数据集上都表现出了最先进的性能。

Nov, 2018