少样本检测一切
本研究致力于解决跨领域小样本目标检测(CD-FSOD)的挑战,提出了一种准确的对象检测器,用于具有最少标记示例的新领域。通过引入多个指标来量化域差异,并建立具有多样化域度量值的新的 CD-FSOD 基准,对一些最先进的开放式对象检测方法进行评估,结果表明,直接采用开放式检测器进行 CD-FSOD 会导致性能下降。“CD-ViTO” 通过引入多种新颖组件,包括微调、可学习的原型模块和轻量级注意力模块,旨在克服性能降级问题并回答提出的第二个问题。实验证明,我们的 CD-ViTO 在领域外和领域内目标数据集上均取得了令人印象深刻的结果,为 CD-FSOD 和 FSOD 建立了新的 SOTAs。所有数据集、代码和模型将向社区发布。
Feb, 2024
本文提出了一种通过视觉和语言知识蒸馏的训练方法 ViLD,使得我们可以使用预先训练的图像分类模型直接检测和分类未知类别的物体,其在 LVIS 和其他数据集上的表现超过了现有的最先进水平。
Apr, 2021
使用 Detic 来训练检测器分类器以扩展其词汇量,从而实现对数万个概念的检测,无需复杂的分配方案,可适用于一系列检测体系结构和骨干网络,在开放词汇和长尾检测基准测试中优于以往的工作。
Jan, 2022
使用开放词汇的目标检测方法,通过利用预训练的视觉语言模型的零样本分类能力,直接对所有可能的新类别的建议进行分类,而不需要额外的注释或数据集。
Oct, 2023
对于开放世界的部署,目标检测器检测和标记新对象的能力对很多实际应用非常关键。本研究提出了一种名为 Open-Set Object Detection and Discovery (OSODD) 的新任务,并且提出了一种称为 Open-Set Regions with ViT features (OSR-ViT) 的检测框架作为解决方案,该框架将无类别假设的倡议网络与强大的 ViT-based 分类器相结合。我们的评估结果表明,OSR-ViT 在性能上远超过现有的有监督方法,并且在低数据场景中表现出色,即使使用少量的训练数据也能优于有监督基线模型。
Apr, 2024
开放词汇检测(OVD)是一种新的目标检测范式,旨在定位和识别由不受限词汇定义的未知对象。本文提出了三种 OVD 方法,并通过实验验证了这些方法在不同设置下的性能。其中,DRR 方法在 OVD-COCO 基准测试中取得了最佳表现,并相对于先前最先进水平获得了 2.8 的 AP$_{50}$ 绝对增益。
Sep, 2023
基于检测导向的图像 - 文本预训练的新的开放词汇检测方法用于填补图像级预训练和开放词汇对象检测之间的差距,通过使探测器头从嘈杂的图像 - 文本对中学习,我们的方法能够利用对比损失学习到新出现的对象 - 语义线索,在 LVIS 和 COCO 基准测试中均获得了非常有竞争力的结果,并在转移检测设置中显著优于基线。
Sep, 2023
提出了一种区域感知的开放词汇视觉 Transformer(RO-ViT)预训练方法,其中使用区域级别的位置嵌入来代替整个图像位置嵌入,取得了在 LVIS 和 COCO 开放词汇检测基准测试的最佳效果。
May, 2023
本文提出一种基于多模态预训练的语言条件检测框架,能够通过自然语言作为知识表示从不同的数据集中积累 “视觉词汇”,解决多数据集训练中的技术难题,并成功应用于超过 35 个目标检测任务,取得最新成果。
Sep, 2022
本论文提出了一种基于少样本目标检测的新的评估协议,旨在在任何外部数据集上预训练和微调检测器,并且通过利用联合学习策略,改进了现有方法,并在 LVIS 和 nuImages 上获得 5.9 个 AP 的提升。
Dec, 2023