适应尺度的三叉戟网络在目标检测中的应用
提出了一种采用比例尺度敏感卷积神经网络的实用目标检测方法。通过平均特征来预测每个卷积滤波器的全局连续比例尺度,并通过通道来提取比例尺度。为了实现快速部署,将鲁棒性分数尺度转换为每个卷积滤波器的固定整数比例尺度组合,利用了膨胀卷积。在 COCO test-dev 上,该模型在 ResNet-101 的两个阶段探测器上分别实现了 41.5 和 42.1 的平均精度,并且无需额外的 FLOPS 即可超越基线模型。
Sep, 2019
本文分析了不同的目标识别和检测技术,针对极端尺度变化进行了比较,比较了尺度特定和尺度不变的设计,提出了一种新的训练方案:图像金字塔尺度归一化检测器(SNIP),并在 COCO 数据集上进行了评估。
Nov, 2017
传统的基于深度学习的目标检测网络通常会在数据预处理阶段调整图像大小,以实现特征图的统一大小和比例。然而,调整大小不可避免地导致对象变形并丢失图像中的有价值信息。为了解决这个问题,我们提出了一种放弃调整大小操作的方法,而是引入了位置编码多头交叉注意力。这使得模型能够捕捉上下文信息并从多个表示子空间中学习,有效丰富了配电塔的语义。此外,我们还通过将三个池化特征图重塑为一个新的统一特征图来增强空间金字塔池化,同时减少计算负担。我们的 SCAResNet 将这些改进整合到了 ResNet 骨干网络中。我们使用了 Duke 大学的电力传输和配电基础设施图像数据集对 SCAResNet 进行了评估。在不使用任何其他技巧的情况下,我们将各种目标检测模型与以高斯感受野为基础的标签分配作为基准。将 SCAResNet 引入基准模型后,我们在 mAP 上实现了 2.1% 的改善。这证明了我们的 SCAResNet 在检测传输和配电塔方面的优势,并体现了其在小型目标检测中的价值。源代码可在此 URL 获取。
Apr, 2024
该论文提出了一种新的卷积神经网络 (CNN) 架构,通过使用具有不同计算复杂度的多分支网络,在不同的尺度上频繁合并特征,以使用更少的计算实现多尺度特征,并在目标识别和语音识别任务上显著提高了模型效率和性能。
Jul, 2018
通过分析 ImageNet-CNNs 和 Places-CNNs 在不同尺度上的响应,本文提出了一种基于尺度的深度学习算法,并发现 scale-specific CNN 对于提高物体场景识别的准确性至关重要。实验结果表明,简单而精心选择的 ImageNet-CNN 和 Places-CNN 的多尺度组合可以将 SUN397 的最新识别准确性推至 66.26%(甚至在更深的架构中达到 70.17%,与人类的表现相当)。
Jan, 2018
本文研究物体检测系统的速度和准确率损失函数,并通过改进模型架构、训练技术等方法,将模型的准确率提升了 7.7%,速度提升了 30%。作者继续提出了简单的缩放策略来探索速度和准确性之间的权衡,产生了两个 Pareto 曲线。最后,作者显示出 ResNet 架构在检测和实例分割系统中的性能要优于 EfficientNet。
Jun, 2021
提出了一种基于网络架构设计的物体提议算法,该算法具有许多优势,例如对物体大小的范围从非常小到非常大的尺度具有平移不变性,具有平移变性的限制框回归,具有大的有效感受野来捕捉全局上下文等,可以显著地提高提议平均召回率,并且实时性能也非常好。
Jul, 2018
本文系统地研究了神经网络结构设计选择以提高计算机视觉中目标检测的模型效率,提出多个优化方案,包括带权重的双向特征金字塔网络、统一调整骨干网络、特征网络、盒类预测网络的分辨率、深度和宽度的复合调节方法,成功开发了名为 EfficientDet 的新一代目标检测器,拥有更高的性能和更小的计算量。
Nov, 2019
本文提出了一种基于卷积神经网络的无尺度检测技术,通过采用上下文感知的 RoI 池化和多分支决策网络,实现了无尺度对象识别,并在多个数据集上达到最优准确性和速度。
Apr, 2018
本文提出了一种数据驱动的神经元分配方法,以自适应地在深度神经网络的不同构建块中汇总多尺度信息。通过使用基于堆栈的采样、卷积和上采样操作生成每个尺度的特征映射,探索神经元分配方法,对计算复杂度进行了大规模的实验测试,并成功地应用于图像分类和目标检测任务,在与 ResNet 和其变体的对比中, ScaleNet 能够获得更好的性能。
Apr, 2019