通过消除启发式 NMS 简化的物体检测

Jan, 2021

通过消除启发式 NMS 简化的物体检测

Object Detection Made Simpler by Eliminating Heuristic NMS

Qiang Zhou, Chaohui Yu, Chunhua Shen, Zhibin Wang, Hao Li

TL;DR本文介绍了一种基于 FCOS 检测模型的 NMS-free 端到端的目标检测框架，使用紧凑的 PSS head 实现单个目标实例的自动选择并消除后处理的 NMS，通过停梯度操作成功解决了一对多和一对一标签分配之间的冲突问题，实现了对 COCO 数据集的优越性能。

Abstract

We show a simple nms-free, end-to-end object detection framework, of which the network is a minimal modification to a one-stage object detector such as the →

object detection fcos detection model nms-free pss head coco dataset

发现论文，激发创造

学习非极大值抑制

通过端到端学习范式，提出了一种利用端盒和分数执行非极大值抑制的新型网络架构，适用于个人检测和一般物体类别（基于 COCO 数据集），能够提供更好的定位和遮挡处理。

May, 2017

全卷积网络实现端到端目标检测

本文针对基于全卷积网络的主流目标检测器在进行完全端到端训练时需要手动设计的非极大值抑制（NMS）后处理方法进行分析，发现正确的标签赋值在其中起着至关重要的作用。本文提出了一种名为预测感知一对一（POTO）的分类标签赋值方法，使得在完全卷积检测器中使用该方法实现了端到端检测，并且与使用 NMS 方法相比具有可比性能。此外，本文还提出了一个简单的三维最大过滤（3DMF）来利用多尺度特征，并提高局部区域内卷积的可区分度。借助这些技术，本文的端到端框架在 COCO 和 CrowdHuman 数据集上取得了与许多最先进的具有 NMS 的检测器相当的性能。

Dec, 2020

端到端目标检测的重要因素是什么？

本篇论文提出了一个新的目标检测算法，通过引入新的匹配成本 - 分类成本，解决了之前检测器中的一对多问题，并引入了得分差来探讨匹配成本的影响，最终证明了端到端的目标检测在拥挤场景下的优势。

Dec, 2020

FCOS：全卷积单阶段目标检测

本文提出了一种全卷积单阶段物体检测器 FCOS，采用针对每个像素的预测方式，类似于语义分割。相对于所有最先进的物体检测器，如 RetinaNet，SSD，YOLOv3 和 Faster R-CNN，FCOS 完全无需先定义参考框，从而避免与参考框相关的计算，例如计算训练过程中的重叠等。通过仅使用后处理的非最大抑制（NMS），FCOS 基于 ResNeXt-64x4d-101 实现了 44.7％的平均精度，超过了以前的单阶段检测器，并具有更为简单的优点。

Apr, 2019

用卷积神经网络进行非最大值抑制

本研究旨在系统地解决非极大值抑制（NMS）的问题，提出了利用卷积神经网络执行给定众多检测结果的 NMS 方法，摆脱贪心 NMS 的固有限制并获得更好的检出率和精度。

Nov, 2015

Fuzzy-NMS：在 NMS 中使用模糊分类改善 3D 物体检测

通过引入模糊学习到非极大值抑制（NMS）中，我们提出了一种新的广义 Fuzzy-NMS 模块，以实现对候选边界框的更细致过滤，通过模糊分类方法将体积和聚类密度相结合，优化适当的抑制阈值并减少 NMS 过程中的不确定性，通过对 KITTI 和 Waymo 等基准测试进行充分验证实验，结果表明所提出的 Fuzzy-NMS 模块能够显著提高许多基于 NMS 的检测器的准确性，尤其对于行人和自行车等小目标。作为即插即用模块，Fuzzy-NMS 无需重新训练并且不会显著增加推论时间。

Oct, 2023

Soft-NMS -- 一行代码改善目标检测

Soft-NMS 算法通过将检测框与最大得分检测框的重叠度作为连续函数的信号降低其得分以替代一般的 NMS 算法进行非极大值抑制，从而提高了目标检测的效果和精度，不需要额外训练，且与常规 NMS 算法的计算复杂度相同。

Apr, 2017

更精确、更整洁的人脸检测：反向非极大值抑制

该论文介绍了一种新的基于 CNN 和 NMS 算法的人脸检测方法，可以有效处理低质量图像和小人脸，可以作为不同人脸检测方法的后处理器。

May, 2023

FCOS：一种简单而强大的无锚点目标检测器

在计算机视觉中，我们提出了一种完全卷积的一阶段对象检测器（FCOS），以像语义分割等其他密集预测问题的方式解决像素级预测对象检测问题，该检测器不需要预定义的基础框，并且避免了与基础框计算相关的超参数，非常简单有效。

Jun, 2020

学习分离：检测城市场景中的严重遮挡物体

本文提出一种名为 SG-Det 的模型，使用一种新颖的嵌入机制来联合利用检测框的语义和几何特征，从而在面对类内遮挡较多的场景时显著提高了检测召回率，特别适用于城市场景的汽车和行人检测，在 KITTI 和 CityPersons 数据集上展示了 SG-Det 模型的最优性能。

Dec, 2019