通过消除启发式 NMS 简化的物体检测
本文针对基于全卷积网络的主流目标检测器在进行完全端到端训练时需要手动设计的非极大值抑制(NMS)后处理方法进行分析,发现正确的标签赋值在其中起着至关重要的作用。本文提出了一种名为预测感知一对一(POTO)的分类标签赋值方法,使得在完全卷积检测器中使用该方法实现了端到端检测,并且与使用 NMS 方法相比具有可比性能。此外,本文还提出了一个简单的三维最大过滤(3DMF)来利用多尺度特征,并提高局部区域内卷积的可区分度。借助这些技术,本文的端到端框架在 COCO 和 CrowdHuman 数据集上取得了与许多最先进的具有 NMS 的检测器相当的性能。
Dec, 2020
本篇论文提出了一个新的目标检测算法,通过引入新的匹配成本 - 分类成本,解决了之前检测器中的一对多问题,并引入了得分差来探讨匹配成本的影响,最终证明了端到端的目标检测在拥挤场景下的优势。
Dec, 2020
本文提出了一种全卷积单阶段物体检测器 FCOS,采用针对每个像素的预测方式,类似于语义分割。相对于所有最先进的物体检测器,如 RetinaNet,SSD,YOLOv3 和 Faster R-CNN,FCOS 完全无需先定义参考框,从而避免与参考框相关的计算,例如计算训练过程中的重叠等。通过仅使用后处理的非最大抑制(NMS),FCOS 基于 ResNeXt-64x4d-101 实现了 44.7%的平均精度,超过了以前的单阶段检测器,并具有更为简单的优点。
Apr, 2019
本研究旨在系统地解决非极大值抑制(NMS)的问题,提出了利用卷积神经网络执行给定众多检测结果的 NMS 方法,摆脱贪心 NMS 的固有限制并获得更好的检出率和精度。
Nov, 2015
通过引入模糊学习到非极大值抑制(NMS)中,我们提出了一种新的广义 Fuzzy-NMS 模块,以实现对候选边界框的更细致过滤,通过模糊分类方法将体积和聚类密度相结合,优化适当的抑制阈值并减少 NMS 过程中的不确定性,通过对 KITTI 和 Waymo 等基准测试进行充分验证实验,结果表明所提出的 Fuzzy-NMS 模块能够显著提高许多基于 NMS 的检测器的准确性,尤其对于行人和自行车等小目标。作为即插即用模块,Fuzzy-NMS 无需重新训练并且不会显著增加推论时间。
Oct, 2023
Soft-NMS 算法通过将检测框与最大得分检测框的重叠度作为连续函数的信号降低其得分以替代一般的 NMS 算法进行非极大值抑制,从而提高了目标检测的效果和精度,不需要额外训练,且与常规 NMS 算法的计算复杂度相同。
Apr, 2017
在计算机视觉中,我们提出了一种完全卷积的一阶段对象检测器(FCOS),以像语义分割等其他密集预测问题的方式解决像素级预测对象检测问题,该检测器不需要预定义的基础框,并且避免了与基础框计算相关的超参数,非常简单有效。
Jun, 2020
本文提出一种名为 SG-Det 的模型,使用一种新颖的嵌入机制来联合利用检测框的语义和几何特征,从而在面对类内遮挡较多的场景时显著提高了检测召回率,特别适用于城市场景的汽车和行人检测,在 KITTI 和 CityPersons 数据集上展示了 SG-Det 模型的最优性能。
Dec, 2019