关键词open-vocabulary segmentation
搜索结果 - 11
- EAGLE: 跨视角理解中高效自适应基于几何的学习
通过引入新的无监督跨视图适应学习方法,我们解决了语义场景理解中不同摄像头视角的几何结构变化建模问题,并在不同跨视图适应基准上证明了我们方法在跨视图建模方面的有效性,与之前的无监督领域适应和开放词汇语义分割方法相比,实现了最先进的性能。
- OpenDAS: 开放词汇切分的领域适应
我们提出了一种基于视觉语言模型的领域自适应方法,通过结合参数高效的提示微调和三元组损失训练策略,提高了开放词汇的普适性,并适应了视觉领域,改善了开放词汇分割任务中的性能。
- 开放词汇分割的可转移和原则性效率
通过利用较小、训练成本更低的模型,本论文的核心策略旨在实现与基于大型视觉语言基础模型的先前开放词汇分割工作相媲美甚至更好的性能,以解决开放词汇分割(OVS)方法面临的高计算开销问题,并在各种 OVS 基准测试中展示了我们在分割准确性和计算成 - 无需指导的开放词汇语义分割
TAG 是一种新颖的方法,用于在计算机视觉中进行无需训练、注释和指导的开放词汇语义分割,通过利用预训练模型以及来自外部数据库的类别标签检索,达到了在 PascalVOC、PascalContext 和 ADE20K 数据集上的开放词汇分割的 - 无配对掩码 - 文本监督下的开放词汇分割
使用独立的图像 - 蒙版和图像 - 文本对,利用不配对的蒙版 - 文本监督,提出了一种新的弱监督开放词汇分割框架 (Uni-OVSeg),通过利用自信的蒙版预测和文本描述中的实体,在 CLIP 嵌入空间中关联一组二进制蒙版和实体,采用大型视 - 语义辅助校准的开放词库分割
本文通过使用 CLIP 的广义上下文先验,通过校准在词汇内和领域偏置的嵌入空间,研究开放词汇分割(OVS)。为了解决这一挑战,我们提出了一个称为 Semantic-assisted CAlibration Network(SCAN)的方法, - 自导引开放词汇语义分割
通过提出自主引导的语义分割(Self-Seg)框架和基于 LLM 的开放式词汇评估器(LOVE),在不需要提供类别名称的情况下,实现了开放式词汇分割的最新成果,并与提供类别名称的方法相竞争,取得了 Pascal VOC、ADE20K 和 C - 重新思考开放词汇分割的评估指标
评估在开放词汇分割中采用的评估指标存在问题,即评估过程仍然严重依赖于零样本或交叉数据集流水线上的闭集指标,而未考虑预测和实际类别之间的相似性。为了解决这个问题,我们首先通过综合定量分析和用户研究使用 WordNet 语言统计、文本嵌入和语言 - 卷积永难逝:单冻结卷积 CLIP 的开放词汇分割
使用共享的冻结卷积 CLIP 骨干网络,将当前的两阶段流程大大简化,并显著提高准确性和成本平衡,成为各种开放词汇语义分割数据集中的最新最佳表现。
- 开放词汇检测和分割综述:过去、现在和未来
计算机视觉中的目标检测和分割作为最基本的任务,在深度学习时代取得了巨大的进展。然而,由于昂贵的手动标注,现有数据集中的标注类别往往规模较小且预定义,即最先进的检测器和分割器无法推广到开放词汇之外。因此,近年来越来越多的关注集中在开放词汇检测 - SegCLIP: 可学习中心的补丁聚合方法用于开放式语义分割
本文提出了一个 CLIP-based 的模型,名为 SegCLIP,以无注释的方式实现了开放式词汇语义分割,其主要思想是通过训练文本 - 图像对来聚集有可学习中心的补丁形成语义区域。文中还在被屏蔽掉的补丁上提出了一种重构损失和基于超像素的