单次拍摄物体检测的空间融合学习

Nov, 2019

单次拍摄物体检测的空间融合学习

Learning Spatial Fusion for Single-Shot Object Detection

Songtao Liu, Di Huang, Yunhong Wang

TL;DR在目标检测中，为了应对尺度变化的挑战，金字塔特征表示是一种常见的做法。本文提出了一种新颖且数据驱动的策略-自适应空间特征融合（ASFF），通过学习如何空间过滤冲突信息来抑制不一致性，从而提高特征的尺度不变性。通过该策略与YOLOv3的结合，在MS COCO数据集上取得了最佳的速度-精度平衡。

Abstract

pyramidal feature representation is the common practice to address the challenge of scale variation in object detection. However, the inco

发现论文，激发创造

M2Det: 基于多级特征金字塔网络的单次检测器

本文提出了一种称为多级特征金字塔网络（MLFPN）的方法，通过融合多级特征从而构建更有效的特征金字塔用于检测不同尺度的对象，并且将MLFPN集成到SSD中构建了名为M2Det的一阶段强大的端到端对象检测器，在MS-COCO基准测试中以单尺度推理策略实现了AP 41.0，以多尺度推理策略实现了AP 44.2，这是一阶段检测器中的新的最佳结果。

Nov, 2018

用于目标检测的标度均衡金字塔卷积

本研究主要探讨了特征金字塔与金字塔卷积在计算机视觉和目标检测中的应用, 提出了一种可提高性能的尺度均衡金字塔卷积模块, 并展示了其在单阶段和双阶段目标检测器上的优越表现.

May, 2020

DetectoRS: 递归特征金字塔和可切换空洞卷积检测物体

本文提出了在物体检测中使用深度神经网络的新的骨干设计——递归特征金字塔和可切换空洞卷积，在COCO test-dev数据集上实现了目前最先进的表现。

Jun, 2020

带有自动对焦的标准化尺度图像金字塔用于目标检测

该论文提出了一种有效的点视觉框架，用于物体检测，其使用尺度归一化的图像金字塔（SNIP）生成已知训练期间可能包含物体的固定尺寸子区域，以提高性能，并通过粗到精的逐步缩小图像金字塔中的感兴趣区域的方法，快速识别物体。

Feb, 2021

RCNet: 反向特征金字塔和跨尺度移位网络用于目标检测

本篇研究提出一种新型的RCNet架构，由Reverse Feature Pyramid(RevFP)和Cross-scale Shift Network (CSN)组成，用于多尺度特征融合，在MS COCO测试集中证明RCNet能够显著提高RetinaNet等检测器的精度

Oct, 2021

语义对齐融合transformer用于一阶段物体检测

研究了在数据稀缺的情况下，单次目标检测的问题，提出了一个效果良好的基于注意力机制的框架，名为Semantic-aligned Fusion Transformer (SaFT)，采用竖直和水平融合模块实现跨尺度和跨样本特征的融合，通过语义对齐的注意力机制大幅提高性能，使得基于目前现有的数据训练的一阶段的检测基线的性能得到了显著提升。

Mar, 2022

AFPN：渐近特征金字塔网络用于物体检测

该论文提出了一种渐近特征金字塔网络（AFPN），通过渐进地将更高层次的特征融入到融合过程中，实现了不相邻层次的直接交互，并采用了自适应空间融合操作来缓解可能出现的多目标信息冲突。实验评估结果表明，AFPN比其他最先进的特征金字塔网络具有更具竞争力的结果。

Jun, 2023

ZoomNeXt: 一种统一的协作金字塔网络用于伪装物体检测

我们提出了一种有效的统一协同金字塔网络用于实现对伪装物体的检测，通过模拟人类行为中的缩放策略来学习具有辨别能力的多尺度语义，并利用富含的粒度感知单元来充分探索候选物体和背景环境之间的不可察觉线索，并结合不确定性意识损失来增强对候选区域的高置信度预测，该方法在图像和视频伪装物体检测基准中始终优于现有的最先进方法。

Oct, 2023

3D目标检测中的大感受野策略与重要特征提取策略

利用3D物体检测、LiDAR点云、动态特征融合模块和特征选择模块以提高网络性能。

Jan, 2024

STF：时空融合模块提升视频目标检测

通过利用视频中连续帧的冗余和相关的互补信息，我们提出了一个时空融合框架，其中包括多帧和单帧关注模块，以及可学习地合并特征图以改进物体检测性能的双帧融合模块。实验证明，该融合模块相比基线物体检测器能够提高检测性能。

Feb, 2024