CAST:自适应段标记的并发识别和分割
本文提出了一种基于像素特征学习的数据驱动的无监督分层语义分割方法,使用同一图像的多视角协同分割来启动特征学习,加入粗细层次间的聚类变换器以确保组织层次间的语义一致性,该方法被称作 'Hierarchical Segment Grouping',在五个主流目标和场景测评基准上表现良好。
Apr, 2022
层次化语义分类需要预测一个层次结构树而不是单个层级的树,通过训练分类器来实现不同层级的准确性和一致性,同时结合图像分割以提高一致性和准确性,并引入树路径 KL 散度损失以强制实现跨层级的一致准确预测和预测层次结构树的准确性。
Jun, 2024
人类视觉识别系统显示了惊人的能力,能够将视觉信息压缩为一组包含丰富表示的令牌,无需标签监督。本文提出了感知分组标记器,一种完全依赖于分组操作的模型,用于提取视觉特征和进行自监督表示学习,其中一系列分组操作被用于迭代地假设像素或超像素的上下文,以改进特征表示。我们表明,与最先进的视觉架构相比,所提出的模型在性能上具有竞争力,并且具有自适应计算和可解释性等可取的属性。具体而言,感知分组标记器在 ImageNet-1K 自监督学习基准测试中以线性探测评估获得 80.3%的性能,标志着这一范例的新进展。
Nov, 2023
该论文提出了一种基于分层结构的图像编码器,通过将图像分解为实例级别、区域级别和整体级别的层次结构,引入了分层解析(HIP)架构,大大提高了基于神经网络的图像描述性能,结合图卷积网络(GCN)可以进一步提高描述性能。
Sep, 2019
文章中提出了一种新的方法来实现医学影像的细粒度子类分割,通过利用任务驱动的数据生成方法、先验拼接模块以及分层混合模型等技术手段,使模型在有限的子类注释数据和充分的高层次注释数据下实现与仅采用子类注释数据相近的结果。
Jul, 2023
本研究提出一种基于树形结构和边界分类器的图像分割的有监督分层方法,实验结果表明该方法在六个公共数据集上实现了最先进的区域分割精度,在没有语义先验的图像分割中具有很强的竞争力。
May, 2015
本文提出了一种新的语义分割方法,使用纯 Transformer 编码图像为序列的方式,通过全局上下文模型和一个简单的解码器生成强大的分割模型,称为 SETR,取得多项最新的测试结果。
Dec, 2020