V3Det:大规模词汇视觉检测数据集
我们在 V3Det 数据集上对监督式大规模词汇视觉检测任务进行了研究,通过调整网络结构、改变损失函数和设计训练策略等一系列改进,我们的模型在 V3Det Challenge 2024 的大规模目标检测 (Supervised) 任务和 Open Vocabulary Object Detection (OVD) 任务中取得了出色的排名。
Jun, 2024
通过分析参与者提交的方法和解决方案,我们旨在激励巨大词汇和开放词汇目标检测领域的未来研究方向,推动该领域的进展。
Jun, 2024
OV-3DETIC 是一个开放式词汇的 3D 点云检测器,使用基于图像的分类监督,并利用伪标签和实现跨模态对比学习方法从 ImageNet1K 扩展了其单词表,从而使点云检测器具有实现开放式词汇检测的能力,并实现了至少 10.77% 的 mAP 绝对值改进。
Jul, 2022
本文介绍了一个新型的大规模基准数据集 BigDetection,它通过整合多个现有数据集并提供更大样本数量、更统一的标注体系,可以用于改进物体检测算法的预训练效果,并已被证明是一个有效的检测方法评估标准。
Mar, 2022
本文提出一种基于多模态预训练的语言条件检测框架,能够通过自然语言作为知识表示从不同的数据集中积累 “视觉词汇”,解决多数据集训练中的技术难题,并成功应用于超过 35 个目标检测任务,取得最新成果。
Sep, 2022
本文探讨了通过分治策略进行开放式词汇 3D 点云检测的方法,该方法使用图像预训练模型来学习定位各种对象,并连接文本和点云表示,以便根据提示文本对新对象类别进行分类,从而实现开放式词汇 3D 目标检测,同时在 ScanNet 和 SUN RGB-D 数据集上实现了显著的性能提升。
Apr, 2023
Object2Scene 和 L3Det 是用于开放词汇 3D 物体检测的首个方法,通过引入大规模的 3D 物体数据集,将物体插入到 3D 场景中来丰富 3D 场景数据集的词汇,并在不同数据集的 3D 对象之间缓解领域差异,并证实了其在 OV-ScanNet-200 基准测试中的有效性。
Sep, 2023
使用 Detic 来训练检测器分类器以扩展其词汇量,从而实现对数万个概念的检测,无需复杂的分配方案,可适用于一系列检测体系结构和骨干网络,在开放词汇和长尾检测基准测试中优于以往的工作。
Jan, 2022
本研究提出一种方法,从大规模图像 - 字幕对中自动生成多样物体的伪包围框注释,以扩大训练基础类别的范围,并通过实验证明该方法在各种数据集上比最先进的开放词汇检测器有更好的检测结果。
Nov, 2021