单次拍摄物体检测的空间融合学习
本文提出了一种称为多级特征金字塔网络(MLFPN)的方法,通过融合多级特征从而构建更有效的特征金字塔用于检测不同尺度的对象,并且将MLFPN集成到SSD中构建了名为M2Det的一阶段强大的端到端对象检测器,在MS-COCO基准测试中以单尺度推理策略实现了AP 41.0,以多尺度推理策略实现了AP 44.2,这是一阶段检测器中的新的最佳结果。
Nov, 2018
本研究主要探讨了特征金字塔与金字塔卷积在计算机视觉和目标检测中的应用, 提出了一种可提高性能的尺度均衡金字塔卷积模块, 并展示了其在单阶段和双阶段目标检测器上的优越表现.
May, 2020
本文提出了在物体检测中使用深度神经网络的新的骨干设计——递归特征金字塔和可切换空洞卷积,在COCO test-dev数据集上实现了目前最先进的表现。
Jun, 2020
该论文提出了一种有效的点视觉框架,用于物体检测,其使用尺度归一化的图像金字塔(SNIP)生成已知训练期间可能包含物体的固定尺寸子区域,以提高性能,并通过粗到精的逐步缩小图像金字塔中的感兴趣区域的方法,快速识别物体。
Feb, 2021
本篇研究提出一种新型的RCNet架构,由Reverse Feature Pyramid(RevFP)和Cross-scale Shift Network (CSN)组成,用于多尺度特征融合,在MS COCO测试集中证明RCNet能够显著提高RetinaNet等检测器的精度
Oct, 2021
研究了在数据稀缺的情况下,单次目标检测的问题,提出了一个效果良好的基于注意力机制的框架,名为Semantic-aligned Fusion Transformer (SaFT),采用竖直和水平融合模块实现跨尺度和跨样本特征的融合,通过语义对齐的注意力机制大幅提高性能,使得基于目前现有的数据训练的一阶段的检测基线的性能得到了显著提升。
Mar, 2022
该论文提出了一种渐近特征金字塔网络(AFPN),通过渐进地将更高层次的特征融入到融合过程中,实现了不相邻层次的直接交互,并采用了自适应空间融合操作来缓解可能出现的多目标信息冲突。实验评估结果表明,AFPN比其他最先进的特征金字塔网络具有更具竞争力的结果。
Jun, 2023
我们提出了一种有效的统一协同金字塔网络用于实现对伪装物体的检测,通过模拟人类行为中的缩放策略来学习具有辨别能力的多尺度语义,并利用富含的粒度感知单元来充分探索候选物体和背景环境之间的不可察觉线索,并结合不确定性意识损失来增强对候选区域的高置信度预测,该方法在图像和视频伪装物体检测基准中始终优于现有的最先进方法。
Oct, 2023
通过利用视频中连续帧的冗余和相关的互补信息,我们提出了一个时空融合框架,其中包括多帧和单帧关注模块,以及可学习地合并特征图以改进物体检测性能的双帧融合模块。实验证明,该融合模块相比基线物体检测器能够提高检测性能。
Feb, 2024