STRAP:基于点监督的结构化物体功能分割
本文提出了一种用于弱监督下的图像标注的全新框架——AffinityNet。该框架通过训练一个深度神经网络,使其能够预测一对相邻图像坐标之间的语义亲和性,从而通过随机游走来实现语义的传播,以生成图像的分割标签。实验表明,使用我们的方法生成的分割标签训练的DNN,甚至比其它依赖于更强监管的模型表现更为优秀。
Mar, 2018
该研究提出了一种只需要点级别注释来训练模型实现物体实例分割的方法,其通过建立一个具有两个分支(定位网络和嵌入网络)的网络,使用伪标签和相似嵌入方法来提高分割效果,在特定情况下,可以获得有竞争力的结果,并且是一种实例分割点级别监督的强基准线。
Jun, 2019
本论文介绍了一个名为 3D AffordanceNet 的数据集,其中包含来自 23 个语义对象类别的 23k 个形状,注释了 18 个视觉可用性类别,并提供了三个评估视觉可用性理解的基准测试任务。作者评估了三种最先进的点云深度学习网络,并研究了半监督学习设置探索利用未标记数据的可能性。综合结果表明,视觉可用性理解是一个有价值但具有挑战性的基准测试。
Mar, 2021
本文介绍使用Transformer结合注意力机制来改善弱监督语义分割的问题,提出了Affinity from Attention和Pixel-Adaptive Refinement模块来学习和精华像素标签和相似度,本方法在多个数据集表现非常出色。
Mar, 2022
本文介绍了一个大规模多视角RGBD视觉可供性学习数据集及其基准测试方法,它包含了来自 37 种对象类别、配有 15 种视觉可供性类别和35 种杂乱/复杂的场景的 47210 个RGBD图像。我们提出了一个名为ARNet的【可供性识别网络】,证明了该数据集的挑战性以及提出的新的强大的可供性学习算法的明确前景。
Mar, 2022
本文提出一种名为LOCATE的框架,采用图像级别的适应性和对象标签对交互区域进行特征嵌入,并将其聚合为人类、对象部分和背景的紧凑原型之一,以指导功能接地的弱监督学习。对于新物体,实验证明我们的方法在训练图像和测试图像上性能都很好。
Mar, 2023
利用标签效率的稀疏注释进行弱监督分割的研究越来越受到关注,以降低费力的像素级标注过程成本,而成对亲和建模技术在此任务中发挥了重要作用。本文将亲和建模作为亲和传播过程,提出了局部和全局成对亲和项,以生成准确的软伪标签,并开发了一种高效算法来显著降低计算成本。该方法可以方便地插入现有的分割网络。在三个典型的标签有效分割任务中进行的实验证明了所提方法的卓越性能。
Oct, 2023
本研究探讨了视觉可供性分割领域中现有方法的可重复性问题,旨在解决由于实验设置不一致导致的比较不公。我们提出在两个单一物体场景下进行基准测试,并引入重新训练的Mask2Former架构,结果显示该模型在大多数测试集上表现最佳,且对尺度变化的敏感性较高。
Sep, 2024