V3Det：大规模词汇视觉检测数据集

Apr, 2023

V3Det：大规模词汇视觉检测数据集

V3Det: Vast Vocabulary Visual Detection Dataset

Jiaqi Wang, Pan Zhang, Tao Chu, Yuhang Cao, Yujie Zhou...

TL;DR提出了一个新的物体检测数据集 V3Det，包含着丰富的边界框和类别层次结构，可以用于 vast 和 open vocabulary 的物体检测任务。

Abstract

Recent advances in detecting arbitrary objects in the real world are trained and evaluated on object detection datasets with a relatively restricted vocabulary. To facilitate the development of more general visual object detection, we propose V3Det, a →

object detection vast vocabulary annotated bounding boxes hierarchical category organization rich annotations

发现论文，激发创造

增强的物体检测：2024 年 V3Det 挑战赛上关于广泛词汇物体检测轨道的研究

我们在 V3Det 数据集上对监督式大规模词汇视觉检测任务进行了研究，通过调整网络结构、改变损失函数和设计训练策略等一系列改进，我们的模型在 V3Det Challenge 2024 的大规模目标检测 (Supervised) 任务和 Open Vocabulary Object Detection (OVD) 任务中取得了出色的排名。

Jun, 2024

2024 年 V3Det 挑战赛：广泛词汇和开放词汇目标检测的方法和结果

通过分析参与者提交的方法和解决方案，我们旨在激励巨大词汇和开放词汇目标检测领域的未来研究方向，推动该领域的进展。

Jun, 2024

基于图像级别分类和去偏置交叉模态对比学习的开放词汇三维检测

OV-3DETIC 是一个开放式词汇的 3D 点云检测器，使用基于图像的分类监督，并利用伪标签和实现跨模态对比学习方法从 ImageNet1K 扩展了其单词表，从而使点云检测器具有实现开放式词汇检测的能力，并实现了至少 10.77% 的 mAP 绝对值改进。

Jul, 2022

BigDetection：用于改善目标检测预训练的大规模基准测试

本文介绍了一个新型的大规模基准数据集 BigDetection，它通过整合多个现有数据集并提供更大样本数量、更统一的标注体系，可以用于改进物体检测算法的预训练效果，并已被证明是一个有效的检测方法评估标准。

Mar, 2022

OmDet: 大规模视觉语言多数据集预训练的语言感知目标检测

本文提出一种基于多模态预训练的语言条件检测框架，能够通过自然语言作为知识表示从不同的数据集中积累 “视觉词汇”，解决多数据集训练中的技术难题，并成功应用于超过 35 个目标检测任务，取得最新成果。

Sep, 2022

DetCLIPv3: 面向多功能的生成式开放分类识别对象检测

DetCLIPv3 是一种高性能检测器，不仅在开放词汇物体检测方面表现出色，还能为检测到的物体生成分层标签。

Apr, 2024

无需三维注释的开放词汇点云物体检测

本文探讨了通过分治策略进行开放式词汇 3D 点云检测的方法，该方法使用图像预训练模型来学习定位各种对象，并连接文本和点云表示，以便根据提示文本对新对象类别进行分类，从而实现开放式词汇 3D 目标检测，同时在 ScanNet 和 SUN RGB-D 数据集上实现了显著的性能提升。

Apr, 2023

Object2Scene：为开放词汇的 3D 检测将对象放入上下文中

Object2Scene 和 L3Det 是用于开放词汇 3D 物体检测的首个方法，通过引入大规模的 3D 物体数据集，将物体插入到 3D 场景中来丰富 3D 场景数据集的词汇，并在不同数据集的 3D 对象之间缓解领域差异，并证实了其在 OV-ScanNet-200 基准测试中的有效性。

Sep, 2023

使用图像级别监督检测二万个类别

使用 Detic 来训练检测器分类器以扩展其词汇量，从而实现对数万个概念的检测，无需复杂的分配方案，可适用于一系列检测体系结构和骨干网络，在开放词汇和长尾检测基准测试中优于以往的工作。

Jan, 2022

带伪边界框标签的开放词汇目标检测

本研究提出一种方法，从大规模图像 - 字幕对中自动生成多样物体的伪包围框注释，以扩大训练基础类别的范围，并通过实验证明该方法在各种数据集上比最先进的开放词汇检测器有更好的检测结果。

Nov, 2021