改进开放词汇目标检测的伪标签
在 Class Incremental Object Detection(CIOD)领域,解决模型如何像人类一样持续学习的问题是一个重大挑战。为了克服传统的伪标签方法在多场景增量学习中遗忘过去知识的问题,该研究介绍了一种名为 Vision-Language Model assisted Pseudo-Labeling(VLM-PL)的新方法。通过将图像和文本特征组合设计的提示模板生成自定义查询,借助视觉 - 语言模型(VLM),VLM-PL 技术能够验证伪标签的正确性,而无需额外的模型训练。通过将精细化的伪标签和真实标签整合,并结合新旧知识,VLM-PL 在 Pascal VOC 和 MS COCO 数据集上进行了广泛实验,不仅在多场景问题上表现出色,还在双场景问题上取得了最先进的结果。
Mar, 2024
该研究提出了一种名为 Pseudo Caption Labeling(PCL)的简单而有效的方法,利用图像字幕模型生成对不同角度目标实例的描述,通过这些大量的数据样本进行知识提炼,以丰富目标的属性和关系等细节,从而提高模型的性能,实验表明该方法可以与任何图像字幕模型一起使用,不需要对模型架构或训练流程进行任何限制。
Mar, 2023
使用开放词汇的目标检测方法,通过利用预训练的视觉语言模型的零样本分类能力,直接对所有可能的新类别的建议进行分类,而不需要额外的注释或数据集。
Oct, 2023
本文提出了一种简单而有效的方法,用于直接学习任意概念的区域 - 文本对齐,从而在开放词汇目标检测方面取得有竞争力的性能和在任意概念的指称表达理解方面取得显著的改进。
Dec, 2023
本文深入研究了半监督目标检测(SSOD)中的两个关键技术,即伪标记和一致性训练,并提出了针对它们的一些问题的解决方案。在 COCO 基准测试中,我们的方法 PseCo 在 1%、5%和 10%标记比下的性能分别超过了 Soft Teacher 的 2.0,1.8 和 2.0 个点,且 SSOD 的学习效率显着提高。
Mar, 2022
本文提出了一种基于置信度的伪标签方法,用于目标检测任务中的半监督目标检测。相较于现有方法,我们的方法可以更好地估计伪标签的分类和定位质量,并根据估计结果调整伪标签产生的阈值和权重,从而缓解类别不平衡和定位精度的问题。我们的实验结果表明,在 COCO 和 PASCAL VOC 数据集上,本方法可以使半监督目标检测的性能提升 1-2% AP,在有限标注的情况下,即使只使用 COCO 的 1-10% 标记数据,我们的方法也能将有监督基线方法的性能提高 10% AP。
Jun, 2021
本文提出了一种基于双重伪标签磨光框架的半监督目标检测方法,通过利用上下文知识对最初产生的伪标签进行双重磨光学习,精确推断未注释对象的伪标签,以提高 SSOD 的泛化性能,并在 PASCAL VOC 和 MS COCO 基准测试中证明了该方法胜过现有最先进的基线方法。
Jul, 2022
本论文提出了一种基于半监督学习的视频显著性目标检测方法,使用伪标签从稀疏注释帧中生成像素级伪标签,并结合部分手动注释,学习了空间和时间线索,进而产生准确的显著性图。实验结果表明,我们的方法在 VOS、DAVIS 和 FBMS 三个公共基准测试数据集上均明显优于所有最先进的全监督方法。
Aug, 2019
针对半监督单目三维物体检测,我们研究了伪标记方法,并发现了两个主要问题:三维和二维属性预测质量之间的不对齐以及伪标签导致的深度监督存在噪声,从而与其他可靠的监督形式产生显著的优化冲突。我们提出了一种新颖的解耦伪标记方法,该方法包括一个用于分别处理二维和三维属性的解耦伪标签生成模块和一个用于减轻由伪标签的深度监督引起的优化冲突的深度梯度投影模块。在 KITTI 基准测试上的综合实验证明了我们方法的优越性。
Mar, 2024
我们提出了一种新的方法来充分利用伪标签,通过引入高和低置信度阈值,使用 Proposal Soft Training (PST) 和 Local Spatial Contrastive Learning (LSCL) 模块来利用低置信度的伪标签,进一步优化了代表性特征。实验证明,我们的方法在五个跨领域目标检测基准上表现优于以前的 Source-free object detection (SFOD) 方法,实现了最先进的性能。
Oct, 2023