深入学习物体检测中的包围盒
本文提出了一种优化锚盒形状以提高目标检测精度的方法,通过动态学习锚盒形状来适应数据分布和网络学习能力,该方法对训练成本几乎没有额外开销,且能够在多个基准数据集上实现显著的改进。
Dec, 2018
本文提出了 FoveaBox 框架,一种准确,灵活且完全无锚点的物体检测方法,通过预测类别敏感的语义图和每个位置的类别不可知的边界框,避免与锚相关的计算和超参数问题。与所有先进的物体检测器不同,FoveaBox 可以直接学习物体的存在可能性和边界框坐标,因此具有更好的性能和通用性。
Apr, 2019
ObjectBox 是一种新颖的单阶段无锚点、高度通用的物体检测方法,通过仅使用对象中心位置作为正样本以及不受对象大小或形状影响地在不同的特征级别平等对待所有对象,解决了现有基于锚点和无锚点检测器在标签分配中偏向特定对象尺度的问题。
Jul, 2022
本文研究了自动优化目标检测锚点的问题,提出了一种结合贝叶斯优化和子采样方法的新型超参数优化方法 AABO,已在不同的检测器和数据集上进行了实验,并证明了通过优化锚点配置可提高 1.4% 至 2.4% 的最大平均精度(mAP),如将 Mask RCNN 从 40.3% 提高到 42.3%,HTC 检测器从 46.8% 提高到 48.2%。
Jul, 2020
本文提出了一种基于角点的目标检测方法,使用 Box Decouple-Couple 策略来预测边界的偏移,设计了 Anchor-Intermediate Detector 模型,其中包含了 anchor-based head 和 corner-aware head,通过实验验证了该方法在 MS COCO 数据集上的有效性。
Oct, 2023
本文提出了一种使用单张图片进行三维目标检测与姿态估计的方法,通过使用深度卷积神经网络来回归相对稳定的三维目标属性,并使用二维边界框提供的几何约束来组合这些估计,从而产生完整的三维边界框。
Dec, 2016
本研究通过引入两种新的边界框回归网络(inception 和 deformable)来在目标检测中提高定位准确性,并在多个基准测试中取得了优于现有方法的表现。
May, 2024
本研究提出了一种基于卷积神经网络的全新框架 DenseBox,可有效地捕捉到多类别物体的边界盒以及物体置信度,同时在多任务学习时结合了关键点定位来进一步提高物体检测精确度,实验结果表明,DenseBox 是目前检测具有挑战性对象(如人脸和汽车)的最先进系统。
Sep, 2015
该论文介绍了一个新型的深度学习框架 Evolving Boxes,可以快速从交通监控摄像头中检测车辆,包括轻量级的候选框网络和精细调整网络,以及不同的特征融合技术,相比 Faster RCNN 在 DETRAC 基准测试中提高了 9.5% 的 mAP,可以在商业 GPU 上以 9-13 FPS 的检测速度运行。
Feb, 2017
本文提出了一种使用动态锚框的新型查询公式,用于 DETR,并对查询在 DETR 中的作用提供了更深入的理解。通过在 Transformer 解码器中直接使用盒子坐标作为查询,动态地逐层更新它们,这种新公式不仅通过使用显式位置先验来提高查询与特征相似度,消除 DETR 中的慢训练收敛问题,而且还允许我们使用盒子宽度和高度信息调制位置注意力映射。
Jan, 2022