深入学习物体检测中的包围盒

ECCVJul, 2020

Dive Deeper Into Box for Object Detection

Ran Chen, Yong Liu, Mengdan Zhang, Shu Liu, Bei Yu...

TL;DR本研究提出一种名为 DDBNet 的盒子重组方法，过滤掉错位的盒子并将选定的盒子分成边界，并将对齐的边界搜索和分组成一种优化盒子，从而实现更准确的定位，得出实验结果表明我们的方法是有效的，并达到了物体检测领域的最高性能。

Abstract

anchor free methods have defined the new frontier in state-of-the-art object detection researches where accurate bounding box estimation is the key to the success of these methods. However, even the →

anchor free methods object detection bounding box localization ddbnet

发现论文，激发创造

目标检测中的锚框优化

本文提出了一种优化锚盒形状以提高目标检测精度的方法，通过动态学习锚盒形状来适应数据分布和网络学习能力，该方法对训练成本几乎没有额外开销，且能够在多个基准数据集上实现显著的改进。

Dec, 2018

FoveaBox：超越基于 Anchor 的目标检测器

本文提出了 FoveaBox 框架，一种准确，灵活且完全无锚点的物体检测方法，通过预测类别敏感的语义图和每个位置的类别不可知的边界框，避免与锚相关的计算和超参数问题。与所有先进的物体检测器不同，FoveaBox 可以直接学习物体的存在可能性和边界框坐标，因此具有更好的性能和通用性。

Apr, 2019

ObjectBox: 从中心到盒子的基于锚点的无锚点目标检测算法

ObjectBox 是一种新颖的单阶段无锚点、高度通用的物体检测方法，通过仅使用对象中心位置作为正样本以及不受对象大小或形状影响地在不同的特征级别平等对待所有对象，解决了现有基于锚点和无锚点检测器在标签分配中偏向特定对象尺度的问题。

Jul, 2022

AABO: 基于贝叶斯子采样的适应锚框优化目标检测

本文研究了自动优化目标检测锚点的问题，提出了一种结合贝叶斯优化和子采样方法的新型超参数优化方法 AABO，已在不同的检测器和数据集上进行了实验，并证明了通过优化锚点配置可提高 1.4% 至 2.4% 的最大平均精度（mAP），如将 Mask RCNN 从 40.3% 提高到 42.3%，HTC 检测器从 46.8% 提高到 48.2%。

Jul, 2020

基于锚点和中间层的检测器：解耦和耦合边界框进行精准目标检测

本文提出了一种基于角点的目标检测方法，使用 Box Decouple-Couple 策略来预测边界的偏移，设计了 Anchor-Intermediate Detector 模型，其中包含了 anchor-based head 和 corner-aware head，通过实验验证了该方法在 MS COCO 数据集上的有效性。

Oct, 2023

使用深度学习和几何学进行 3D 边界框估计

本文提出了一种使用单张图片进行三维目标检测与姿态估计的方法，通过使用深度卷积神经网络来回归相对稳定的三维目标属性，并使用二维边界框提供的几何约束来组合这些估计，从而产生完整的三维边界框。

Dec, 2016

一种新的边界框回归方法用于单目标跟踪

本研究通过引入两种新的边界框回归网络（inception 和 deformable）来在目标检测中提高定位准确性，并在多个基准测试中取得了优于现有方法的表现。

May, 2024

DenseBox: 将关键点定位与端到端目标检测统一

本研究提出了一种基于卷积神经网络的全新框架 DenseBox，可有效地捕捉到多类别物体的边界盒以及物体置信度，同时在多任务学习时结合了关键点定位来进一步提高物体检测精确度，实验结果表明，DenseBox 是目前检测具有挑战性对象（如人脸和汽车）的最先进系统。

Sep, 2015

快速车辆检测的进化框盒

该论文介绍了一个新型的深度学习框架 Evolving Boxes，可以快速从交通监控摄像头中检测车辆，包括轻量级的候选框网络和精细调整网络，以及不同的特征融合技术，相比 Faster RCNN 在 DETRAC 基准测试中提高了 9.5% 的 mAP，可以在商业 GPU 上以 9-13 FPS 的检测速度运行。

Feb, 2017

DAB-DETR：动态锚框是 DETR 更好的查询方式

本文提出了一种使用动态锚框的新型查询公式，用于 DETR，并对查询在 DETR 中的作用提供了更深入的理解。通过在 Transformer 解码器中直接使用盒子坐标作为查询，动态地逐层更新它们，这种新公式不仅通过使用显式位置先验来提高查询与特征相似度，消除 DETR 中的慢训练收敛问题，而且还允许我们使用盒子宽度和高度信息调制位置注意力映射。

Jan, 2022