- 跨领域开放世界发现
通过引入簇 - 匹配策略和面向跨域开放世界发现设计的目标,CROW 通过在稳定的表示空间中强大地匹配簇和之前见过的类别,从而发现新类别,并通过针对跨域开放世界发现设计的目标来精细调整表示空间,实验结果表明 CROW 在图像分类基准数据集上优 - 开放词汇空间时间动作检测
通过对现有 STAD 数据集建立两个基准,并提出基于预训练视频 - 语言模型的简单而有效的方法,我们在新的类别上取得了令人期待的性能,通过训练一个在有限的基本类别上的模型来具备好的泛化性能。
- CVPR通用少样本遥感:基于混合语义分割框架的地貌涵盖映射中的新类发现
提出了一种名为 SegLand 的广义少样本分割框架,用于在高分辨率土地覆盖映射中更新新颖类别,实验表明该框架在有限标记数据下自动更新新颖土地覆盖类别方面具有优越性。
- 无需训练的自信度聚合增益对开放词汇物体检测的改进
研究着重探讨开放词汇对象检测 (OVOD) 中的问题,包括对新类别的检测性能不佳以及候选区域和对象分类阶段的局限性,并提出了一种后处理方案(AggDet),通过两种先进的衡量方法来调整信心分数和恢复误判的对象,并在 OV-COCO 和 OV - YOLOOC:基于 YOLO 的开放类增量目标检测与新类发现
通过构建新的基准测试,我们提出了一种基于 YOLO 架构的新型 OWOD 检测器 YOLOOC,在遇到新的类别时能够自动学习并避免忘记先前已知的类别,我们引入了标签平滑技术来防止检测器过度自信地将新类别映射为已知类别,并在我们的测试基准中的 - AAAI自适应发现和合并用于增量式新类别发现
提出了一种自适应发现和合并(ADM)的新范式,用于在增量阶段自适应地发现新类别并将新知识整合到模型中,通过减少对旧类别的干扰来保留先前知识,并在不降低性能和参数增长的情况下将新分支合并到基本模型中,从而显著优于现有的类别增量性新类别发现方法 - 基于语义关系引导的双视角数据超分辨率方法用于少样本图像识别
通过利用语义关系引导双视图数据幻影,为小样本图像识别提供更多样化和合理化的新数据样本,该框架能通过从基础类别中进行有效的信息传递生成新颖类别的样本。其中,实例视图数据幻影模块利用基础类别的局部语义相关注意力和全局语义特征融合生成新颖类别的每 - 基于背景聚类的少样本分割预训练
本研究提出了一种新的针对少样本分割的预训练方案,通过将新颖类别与背景解耦来解决合并背景问题,称为背景聚类预训练(BCPT),实验证明 BCPT 在 PASCAL-5i 和 COCO-20i 数据集上获得了先进的性能表现。
- 通过层次特征对齐预训练和区域感知微调的通用标签高效三维场景解析
通过使用预先训练的视觉 - 语言模型和无监督的区域级语义对比学习方案,本研究提出了一种通用且简单的框架,用于处理有限标记情况下的 3D 场景理解,从而在数据效率学习和开放世界少样本学习方面展现了有效性。
- DST-Det: 开放词汇目标检测的简单动态自训练
使用开放词汇的目标检测方法,通过利用预训练的视觉语言模型的零样本分类能力,直接对所有可能的新类别的建议进行分类,而不需要额外的注释或数据集。
- 现实世界中基于半监督的开放式通用关系发现
这篇论文提出了一种名为 KNoRD 的方法,该方法在未标记数据中识别明确和隐含的关系,并有效地分类已知和新的关系类别,是 Open-world Relation Extraction 领域的最新研究成果。
- TagCLIP:提高开放式语料库语义分割的区分能力
本研究针对 CLIP 在像素级开放词汇学习任务中面临的输入像素误识别问题,提出了一种名为 TagCLIP 的改进方法,通过引入一种名为 trusty token 的可信标记,成功提高了现有模型的泛化容量。针对 PASCAL VOC 2012 - AAAI即使没有基础数据也能实现更好的泛化小样本学习
本文介绍和研究了零基础广义少样学习(zero-base GFSL),提出了一种简单而有效的归一化方法,可以有效控制新类的权重分布的均值和方差,实现了对新类和基类的令人满意的性能,并且不使用任何基本样本的零基础 GFSL 方法甚至优于利用基本 - 新颖程度对于半监督表征学习用于新类别检索的影响
本研究探讨使用半监督学习方法在训练集中加入未标记的新类图片,以提高表示学习在搜索新类别图片时的效率,并提出了一种新的评估方法来评估基于半监督学习方法的表示学习,在语义差异较大时,相比于传统监督学习,基于半监督学习的表示学习可以在搜索新类别图 - ECCVOpenLDN: 学习发现新类别用于开放式半监督学习
本文介绍了一种名为 OpenLDN 的方法,该方法针对半监督学习中存在的已标记数据和未标记数据来自于相同数据分布的困难,解决了开放世界半监督学习的问题,通过使用成对相似性损失来识别已知类别的样本,同时探测和聚类未标记数据中属于新类别的样本。 - Few-shot 类增量学习的基本和新颖表现揭秘
本文研究了 few-shot class-incremental learning (FSCIL) 问题,提出了一种基于规范化原型分类器的简单方法,名为 NoNPC,该方法适用于增量式新类别的识别,具有与先进算法相当的性能表现。
- 零样本物体导向视觉导航
本文研究了零样本对象目标视觉导航任务,并提出了一种基于语义相似性网络的新型框架,用于在未训练过的类中引导机器人查找目标,通过在 AI2-THOR 平台上进行了广泛的实验,证明了我们模型的一般化能力强于基线模型。
- 使用开放世界建议扩展单阶段检测
本文研究在目标检测中如何应对训练集中未出现的物体,提出了一种称为 Open World Detection (OWD) 的解决方案,并探究了将 Open-World Proposals (OWP) 应用于全卷积单阶段检测网络的可能性和优化方 - 稳健的跨模态伪标记开放词汇实例分割
本文提出一种跨模态伪标签(cross-modal pseudo-labeling)框架,用于面向开放词汇的实例分割,通过与对象掩膜的视觉特征对齐,实现对字词语义中的新类别进行标记,从而自我训练出一个学生模型,缓解了伪掩膜中存在的噪声干扰所带 - ICCV明确学习和校准进行增量化通用少样本学习而无遗忘
本论文提出了一个三阶段框架来解决 Few-shot 学习中的挑战,包括学习新类别,避免基类的灾难性遗忘以及横跨新基类的分类器校准,通过在图像和视频少样本分类的四个基准数据集上的实验证明该框架达到了最先进的结果。