SODA10M 挑战赛 2021 -- 持续检测赛道第二名解决方案
本文介绍了我们在 Waymo 开源数据集上使用的解决方案,使用了 FPN、Cascade RCNN、stacked PAFPN Neck 和 Double-Head 等技术对性能进行了提升,在训练和测试中使用了非常大的图像尺度,并使用这些方法,在 2D 物体检测领域获得了第一名。
Aug, 2020
本研究提出了一个名为 SODA10M 的大规模数据集,包含 1000 万张未标注图像和 2 万张标注有 6 种代表性对象类别的图像,用于标准化不同自监督和半监督学习方法的评估,是迄今为止第一个最大的数据集。该数据集为自动驾驶系统的目标检测提供了优秀的无监督预训练数据源,显示出在自动驾驶领域的不错性能。
Jun, 2021
使用 512 个 GPU 的 PFDet - 一种大规模目标检测系统,可以处理大量数据集,支持稀疏验证类和大规模类不平衡,并在 Kaggle 上取得了 Google AI Open Images 目标检测排名第二。
Sep, 2018
提出 Deeply Supervised Object Detectors(DSOD)框架,实现可以从头开始训练的目标检测器。通过 Layer-wise Dense 连接在主干网和预测层之间实现深度监督,DSOD 能在 PASCAL VOC 和 COCO 数据集上取得比现有方法更好的检测结果,并使用更小的模型参数。
Sep, 2018
提出了一种用于自动驾驶目标检测的方法,通过平衡损失来缓解类别不平衡,采用梯度重塑的归纳层快速学习有限样本的新类别,通过归一化特征蒸馏来防止灾难性遗忘,并通过 FPN 和基于能量的检测提高多尺度检测稳健性和未知类别识别性能,实验证明该方法在 CODA 数据集上表现出更好的性能。
Nov, 2023
本研究提出了一种名为 DSOD 的新型深度监督目标检测器,通过设计一组原则以及采用密集的层内连接等手段使目标检测器可以从零开始训练,并在 PASCAL VOC 2007,2012 和 MS COCO 等数据集上完美取代了现有的模型。
Aug, 2017
本研究提出了一个新的高分辨率显著物体检测 (High-Resolution SOD) 方法,该方法使用 HRS10K 数据集和递归多尺度 Transformer (RMFormer) 生成高分辨率显著图。对高分辨率和低分辨率基准测试的广泛实验证明该框架的有效性和优越性。
Aug, 2023
该研究报告详细介绍了他们对 Google AI Open Images Challenge 2019 目标检测赛题的解决方案。通过对 Open Images 数据集进行详细分析,提出了采用大型骨干网络、分布式 softmax 损失、类别感知采样等策略,在最优模型的基础上进行模型融合,最终在该挑战中获得了第三名,公共排行榜 mAP 为 67.17,私有排行榜为 64.21。
Oct, 2019
本文介绍了两个冠军团队在 OpenImage Challenge 2019 中的解决方案。我们基于对分类和回归问题进行特征提取的实践,提出了 Decoupling Head (DH) 技术,在目标分类和定位问题中取得了巨大的性能提升。此外,我们还对 soft-NMS 算法进行了调整,提出了一种 ensemble strategy 来控制识别结果的准确性,最终我们在比赛中获得了第 1 名,并在实例级语义分割方面取得了优异的表现。
Mar, 2020
介绍了一种无锚点、无 NMS 的 3D 点云目标检测器,使用对象关键点编码 3D 属性实现端到端检测,利用数据增强和点着色以及投影到相机空间和图像感知信息的附加属性来增强性能,并通过模型集成和 TTA 在 3D 检测和域自适应路线上实现了第一名。
Jun, 2020