解耦稠密物体检测器
本研究提出了一种名为 DSOD 的新型深度监督目标检测器,通过设计一组原则以及采用密集的层内连接等手段使目标检测器可以从零开始训练,并在 PASCAL VOC 2007,2012 和 MS COCO 等数据集上完美取代了现有的模型。
Aug, 2017
提出 Deeply Supervised Object Detectors(DSOD)框架,实现可以从头开始训练的目标检测器。通过 Layer-wise Dense 连接在主干网和预测层之间实现深度监督,DSOD 能在 PASCAL VOC 和 COCO 数据集上取得比现有方法更好的检测结果,并使用更小的模型参数。
Sep, 2018
本研究提出了一种名为 DeFeat 的新型知识蒸馏算法,通过解耦区域特征和分类头提议来提高学生检测器的性能,以实现从复杂教师网络到紧凑学生网络的信息遗传。实验结果表明,DeFeat 相较于先前的知识蒸馏方法可以取得更好的物体检测成果。
Mar, 2021
本文提出了一种改进的 FSOD 模型来解决样本不均衡和特征传播不足的问题,通过解耦基类和少样本类的参数以及引入编码器和解码器之间的跳跃连接,构建一个统一解码器模块,能够动态融合解码器的中间层作为输出特征,实验结果显示,在 PASCAL VOC 和 MSCOCO 等常用数据集上,我们的模型在微调和元学习范式中稳定提升了 5% 到 10%,并且超过了近期工作的最高得分。
Nov, 2023
该研究提出了一种通过单个 RGB 图像实现单目 3D 物体检测的方法,采用新颖的去耦合转换来实现 2D 和 3D 检测损失,以及一种新颖的自监督置信度分数来实现 3D 边界框。该方法通过隔离参数组对给定损失的贡献来解决了复杂互动参数存在的问题。同时,作者还通过改善 2D 检测结果的有符号交并比驱动损失来应用了损失去耦合。通过基于 KITTI3D 和 nuScenes 数据集的广泛实验评估和消融研究,该方法在车类别目标检测方面实现了新的最优成果。
May, 2019
本文研究了单阶段物体检测器比两阶段物体检测器速度更快,但精度更低的原因,并提出了一种名为 Focal Loss 的做法,以解决稠密检测器训练中遇到的前景背景类别不平衡问题,该方法能够提高准确性。在该方法的基础上设计了一种名为 RetinaNet 的密集型检测器,取得了超过现有首屈一指的两阶段检测器的精度。
Aug, 2017
本文介绍了两个冠军团队在 OpenImage Challenge 2019 中的解决方案。我们基于对分类和回归问题进行特征提取的实践,提出了 Decoupling Head (DH) 技术,在目标分类和定位问题中取得了巨大的性能提升。此外,我们还对 soft-NMS 算法进行了调整,提出了一种 ensemble strategy 来控制识别结果的准确性,最终我们在比赛中获得了第 1 名,并在实例级语义分割方面取得了优异的表现。
Mar, 2020
本文提出了一种 Attention Loss 函数结合多任务深度对象遮挡边界检测网络,并采用编码器 - 解码器结构,通过共享卷积特征来同时预测对象边界和遮挡方向,大幅度提高了 PIOD 数据集和 BSDS 拥有数据集上的检测速度(每图像 0.037s)并显著超过了之前的最优结果(ODS F 分数分别为 0.702 和 0.555)。
Jun, 2018
本文提出了一种基于预训练卷积神经网络的物体部位发现和定位方法 PDD,通过分析网络输出的梯度映射并找到与语义部分或边界框有空间关系的激活中心,实现对 CUB200-2011 数据集进行优秀的监测和分类性能,同时不需要在测试期间给定边界框或计算真假部分。
Nov, 2014
本文提出了一种新的监督范式,称为相互监视(MuSu),为密集探测器中的分类和回归头分别和相互分配训练样本,以确保对检测管道中的物体进行准确检测的一致性。实验结果表明,使用这种相互监视进行训练可以保证检测器的收敛性,并且在具有挑战性的 MS COCO 基准测试中验证了所提出的方法的有效性。
Sep, 2021