普适感知分组
本文介绍了一种有效的感知推断框架,该框架能够显式地处理输入和特征的分割,并通过增强神经网络的表示能力并对对象表示进行迭代分组,以及对其分组迭代推理进行摊销从而实现了快速收敛,相比其他处理多物体场景的方法,该方法不假设输入为图像,因此可以直接处理其他模态,并在处理具有纹理分割的复杂图像时提供更好的分类性能。
Jun, 2016
本文介绍了一种称为深度分组模型的方法,该方法可以将视觉感知组合过程融入到最新的卷积神经网络中进行图像分割,并在基于 Broden + 数据集的统一感知解析任务中实现了最优结果。
Mar, 2020
本文提出了一种新的具有可学先验的空间混合模型来实现感知分组。 该方法将对象的属性划分为 “形状” 和 “外观”,并通过神经网络分别建模。 在感知分组数据集上进行的广泛实证测试表明,所提出的方法在大多数实验配置下优于现有的方法。
Feb, 2019
人类视觉识别系统显示了惊人的能力,能够将视觉信息压缩为一组包含丰富表示的令牌,无需标签监督。本文提出了感知分组标记器,一种完全依赖于分组操作的模型,用于提取视觉特征和进行自监督表示学习,其中一系列分组操作被用于迭代地假设像素或超像素的上下文,以改进特征表示。我们表明,与最先进的视觉架构相比,所提出的模型在性能上具有竞争力,并且具有自适应计算和可解释性等可取的属性。具体而言,感知分组标记器在 ImageNet-1K 自监督学习基准测试中以线性探测评估获得 80.3%的性能,标志着这一范例的新进展。
Nov, 2023
本文探讨了从无标签场景中心数据中学习视觉表示的问题,提出了一种的基于对比学习和数据驱动语义槽的语义聚类和表示学习方法,通过此方法能够更好的区分特征和语义相符的像素点,以此来有效地分解场景中的像素群组,并显著提高目标检测、实例分割和语义分割等下游应用的效果。
May, 2022
本文提出了一种针对手绘图像的分割算法,该算法通过使用个性化的提取部件注释,以及简单的 sketch 进行训练,实现了对手绘图像的分割。该算法通过使用简单的 sketch 训练的多阶段变形网络进行随意手绘的分割,相比基于 few-shot 和 state-of-the-art 方法提高了 10% 准确率
Dec, 2021
本文提出了一种通用的半监督语义分割框架,旨在在各种应用领域实现更低的注释和部署成本,并通过像素感知熵正则化的特征对齐目标来最小化有监督以及无监督损失,以实现在多个领域中都能使用单一模型,利用少量标记实现性能提升,同时可以处理不同领域的标签空间不同的问题。
Nov, 2018
本研究提出一种基于学习的聚合聚类框架,在提取局部上下文以促进泛化到未知类别的情况下,学习部件的几何先验知识,并在不看到任何注释样本的情况下将其应用到未见过的类别中,实现了对大规模细粒度 3D 零件数据集 PartNet 的有效分割。
Feb, 2020
这篇论文研究了一项名为统一感知分析的新任务,通过开发 UPerNet 多任务框架和一种训练策略来实现从给定图像中识别尽可能多的视觉概念,最后在自然场景中应用训练网络来发现视觉知识。
Jul, 2018