SODA10M 挑战赛 2021 -- 持续检测赛道第二名解决方案

ICCVOct, 2021

SODA10M 挑战赛 2021 -- 持续检测赛道第二名解决方案

2nd Place Solution for SODA10M Challenge 2021 -- Continual Detection Track

Manoj Acharya, Christopher Kanan

TL;DR介绍在自监督学习下连续物体检测的方法，基于 ResNet50-FPN 模型，在模型校准、任务特定的重放机制、学习率调度、使用原始图像尺度等方面进行了多项改进，提高了大型和小型物体的性能，并在 SODA10M 比赛中获得了第二名。

Abstract

In this technical report, we present our approaches for the continual object detection track of the SODA10M challenge. We adapt resnet50-fpn as the baseline and try several improvements for the final submission model. We find that →

continual object detection resnet50-fpn task-specific replay scheme learning rate scheduling self-supervised learning

发现论文，激发创造

Waymo Open Dataset Challenge 2020 2D 目标检测赛道第一名方案

本文介绍了我们在 Waymo 开源数据集上使用的解决方案，使用了 FPN、Cascade RCNN、stacked PAFPN Neck 和 Double-Head 等技术对性能进行了提升，在训练和测试中使用了非常大的图像尺度，并使用这些方法，在 2D 物体检测领域获得了第一名。

Aug, 2020

SODA10M: 一个用于自动驾驶的大规模 2D 自 / 半监督目标检测数据集

本研究提出了一个名为 SODA10M 的大规模数据集，包含 1000 万张未标注图像和 2 万张标注有 6 种代表性对象类别的图像，用于标准化不同自监督和半监督学习方法的评估，是迄今为止第一个最大的数据集。该数据集为自动驾驶系统的目标检测提供了优秀的无监督预训练数据源，显示出在自动驾驶领域的不错性能。

Jun, 2021

PFDet: 2018 年 Open Images 挑战赛目标检测赛道的第二名方案

使用 512 个 GPU 的 PFDet - 一种大规模目标检测系统，可以处理大量数据集，支持稀疏验证类和大规模类不平衡，并在 Kaggle 上取得了 Google AI Open Images 目标检测排名第二。

Sep, 2018

从头开始使用深度监督进行物体检测

提出 Deeply Supervised Object Detectors（DSOD）框架，实现可以从头开始训练的目标检测器。通过 Layer-wise Dense 连接在主干网和预测层之间实现深度监督，DSOD 能在 PASCAL VOC 和 COCO 数据集上取得比现有方法更好的检测结果，并使用更小的模型参数。

Sep, 2018

OpenNet: 自动驾驶目标检测的增量学习与平衡损失

提出了一种用于自动驾驶目标检测的方法，通过平衡损失来缓解类别不平衡，采用梯度重塑的归纳层快速学习有限样本的新类别，通过归一化特征蒸馏来防止灾难性遗忘，并通过 FPN 和基于能量的检测提高多尺度检测稳健性和未知类别识别性能，实验证明该方法在 CODA 数据集上表现出更好的性能。

Nov, 2023

DSOD：从头开始学习深度监督目标检测器

本研究提出了一种名为 DSOD 的新型深度监督目标检测器，通过设计一组原则以及采用密集的层内连接等手段使目标检测器可以从零开始训练，并在 PASCAL VOC 2007，2012 和 MS COCO 等数据集上完美取代了现有的模型。

Aug, 2017

高分辨率显著目标检测的循环多尺度 Transformer

本研究提出了一个新的高分辨率显著物体检测 (High-Resolution SOD) 方法，该方法使用 HRS10K 数据集和递归多尺度 Transformer (RMFormer) 生成高分辨率显著图。对高分辨率和低分辨率基准测试的广泛实验证明该框架的有效性和优越性。

Aug, 2023

基于数据不平衡的大规模分层目标检测高效网络学习：Open Images Challenge 2019 第三名方案

该研究报告详细介绍了他们对 Google AI Open Images Challenge 2019 目标检测赛题的解决方案。通过对 Open Images 数据集进行详细分析，提出了采用大型骨干网络、分布式 softmax 损失、类别感知采样等策略，在最优模型的基础上进行模型融合，最终在该挑战中获得了第三名，公共排行榜 mAP 为 67.17，私有排行榜为 64.21。

Oct, 2019

OpenImage2019 目标检测和实例分割比赛冠军解决方案

本文介绍了两个冠军团队在 OpenImage Challenge 2019 中的解决方案。我们基于对分类和回归问题进行特征提取的实践，提出了 Decoupling Head (DH) 技术，在目标分类和定位问题中取得了巨大的性能提升。此外，我们还对 soft-NMS 算法进行了调整，提出了一种 ensemble strategy 来控制识别结果的准确性，最终我们在比赛中获得了第 1 名，并在实例级语义分割方面取得了优异的表现。

Mar, 2020

Waymo 开放数据集挑战赛 3D 检测和域自适应解决方案第一名

介绍了一种无锚点、无 NMS 的 3D 点云目标检测器，使用对象关键点编码 3D 属性实现端到端检测，利用数据增强和点着色以及投影到相机空间和图像感知信息的附加属性来增强性能，并通过模型集成和 TTA 在 3D 检测和域自适应路线上实现了第一名。

Jun, 2020