- SOOD++:利用无标签数据提升有向物体检测
通过使用无标签数据提升目标检测器的半监督方法,我们提出了一种简单而有效的半监督定向目标检测方法 SOOD++,该方法在多方向对象和航拍图像方面获得了较好的结果。
- uDistil-Whisper: 通过大规模伪标签进行无标签数据过滤的知识蒸馏
该研究论文提出了一种无监督或无标签的框架来提炼 Whisper 模型,通过这种方法,在没有使用任何标记数据的情况下,使得提炼出的模型在性能上能与教师模型相媲美或更好,并且计算和内存效率相对更高。
- SimTxtSeg:基于简单文本线索的弱监督医学图像分割
本研究提出了一种利用简单文本提示生成高质量伪标签、并研究训练分割模型中的跨模态融合的新框架 SimTxtSeg,其中包括两个关键组件:从医学图像的文本提示中产生视觉提示的有效的文本 - 视觉提示转换器,以及融合文本和图像特征的文本引导分割模 - 低维混合专家模型在医学图像分割中的应用
在医学图像分割领域的持续学习任务中,我们提出了一种使用数据特定的专家组(MoE)结构解决新任务或类别的问题的网络,以确保网络参数对先前任务的影响最小化,并通过引入低秩策略显著降低引入附加结构所带来的内存开销。在多个数据集上进行的广泛实验证明 - CVPRCVPR2024 基础 Few-Shot 目标检测挑战的解决方案
本报告介绍了一种增强的方法来解决基础性少样本物体检测任务,利用视觉语言模型 (VLM) 进行物体检测。为解决 VLM 可能遇到的与目标概念不一致的问题,本研究提出了 VLM + 框架,把多模态大型语言模型 (MM-LLM) 集成到 VLM - ALPS:遥感分割的自动标注和预训练方案
我们提出了一种名为 ALPS 的创新自动标注框架,利用 Segment Anything Model (SAM) 预测遥感图像的准确伪标签,从而填补了遥感图像分析领域中海量未标注数据集和充分利用这些数据集进行高级 RS 分析之间的鸿沟。
- 少即是多:持续测试时间适应的伪标签过滤
在测试阶段无需访问源数据,连续测试时适应 (CTTA) 旨在将预训练模型调整到一系列目标领域。为了适应未知领域的无标签数据,现有方法依赖于为所有样本构建伪标签并通过自我训练来更新模型。然而,这些伪标签往往包含噪声,导致适应不足。为了提高伪标 - 自监督特征适应的广义半监督学习
通过提出自监督特征适应(SSFA)方法,解决了传统半监督学习在标记和未标记数据分布不一致时预测错误伪标签的问题,从而提高了半监督学习性能。
- 针对半监督 3D 物体检测的硬度感知场景合成
提出了一种基于自适应合成场景的 3D 目标检测方法,通过生成适应性合成场景来改善检测模型的泛化能力,包括生成伪标签、不同对象和背景组合生成多样化的场景,并通过硬度感知策略来减小低质量伪标签的影响,保证合成场景的多样性和质量,实验证明了该方法 - 黑盒无监督领域自适应的增量伪标签
通过增量选择高置信度伪标签来改善目标模型的泛化能力,实验结果表明该方法在三个基准数据集上达到了最先进的黑盒无监督领域适应性能。
- 自动驾驶的 3D 无监督学习:通过提炼 2D 开放词汇分割模型实现
提出了一种由 2D 开放词汇的分割模型辅助的新型三维无监督框架(UOV),通过学习未标注数据的点云表征,采用了两个阶段:首先,创新地结合了 2D 开放词汇模型的高质量文本和图像特征,提出了三模态对比预训练(TMP);其次,利用点云和图像之间 - 利用固定和动态伪标签进行半监督医学图像分割
利用多个伪标签进行半监督医学图像分割,可以提高模型性能和泛化能力。验证结果显示,这种新方法在几个医学图像数据集上的表现明显优于现有方法。
- 基于邻居关系的鲁棒伪标签学习方法用于无监督可见 - 红外人物再识别
无监督可见 - 红外人物重识别 (USVI-ReID) 中的伪标签校准与邻近关系学习方法 (RPNR) 能够有效改进模型鲁棒性和提高准确度。
- 适用于文档中的表格检测的调制物体查询的端到端半监督方法
本研究提出了一种创新的基于 Transformer 的半监督表格检测器,通过结合一对一和一对多分配技术的新型匹配策略提高了伪标签质量,在早期阶段显著提高了训练效率,进而确保了更好的伪标签进行进一步训练。该方法在多个基准数据集上进行了全面评估 - 通过大型语言模型从动作中学习对象状态
通过使用大型语言模型,我们提出了一种从指导视频中的动作信息中提取物体状态信息的方法,并使用所生成的伪标签对模型进行训练,从而明确从动作中提取出物体状态信息的有效性。
- 上下文相关:利用时空元数据进行遥感图像的半监督学习
利用时空元信息提高伪标签的质量以及最终模型的性能,我们提出了一种名为时空半监督学习(Spatiotemporal SSL)的框架,通过在训练集上仅将元信息应用于教师模型以改善伪标签的质量,使学生网络在测试时对时空变化具有不变性,并引入了一种 - CVPR户外无监督三维物体检测常识原型
本研究提出了一种基于常识原型的检测器(CPD),用于无监督的三维物体检测,通过构建高质量边界框和密集点的常识原型以及利用大小先验和几何知识改进了低质量伪标签,有效提高了检测性能。CPD 在多个数据集上取得了优于现有方法的结果,使其与全监督检 - LEAF:半监督面部表情识别中同一枚硬币的两面
本文提出了一种统一的框架 LEAF(Hierarchical dEcoupling And Fusing),通过协调与半监督面部表情识别相关的表征和伪标签,解决了标签稀缺性带来的挑战,在三个层次上操作:语义、实例和类别,并在基准数据集上进行 - 实时医学视频标注的即时点注释
我们提出了一种即时视频标注的方法来提高标注效率,通过在实时视频中保持光标在对象上的持续单点注释,减少传统标注方法中的暂停和重复导航需求,从而实现了 3.2 倍的标注速度提升,并在开发的数据集上在等价的标注预算下取得了 6.51+-0.98 - ICLR自助学习的开放世界层次化实体分割 (SOHES)
本研究提出了具有自我监督的开放世界分层实体分割(SOHES)方法,通过视觉特征聚类生成高质量伪标签,利用师生互相学习过程解决伪标签中的噪声问题,从而在只使用原始图像作为训练数据的情况下,在无人标记掩码的情况下实现了自我监督的开放世界分割。