STRAP：基于点监督的结构化物体功能分割

Apr, 2023

STRAP：基于点监督的结构化物体功能分割

STRAP: Structured Object Affordance Segmentation with Point Supervision

Leiyao Cui, Xiaoxue Chen, Hao Zhao, Guyue Zhou, Yixin Zhu

TL;DR本研究提出了一种利用点监督的密集预测网络，以处理存在双重亲和力（标签亲和力和空间亲和力）的能力分割问题，并使用Transformer骨干进行全局补丁交互和正则化损失，该方法在CAD120数据集上取得了显著的性能提升。

Abstract

With significant annotation savings, point supervision has been proven effective for numerous 2D and 3D scene understanding problems. This success is primarily attributed to the structured output space; i.e., samples with high →

发现论文，激发创造

点级监督的语义分割

本文提出了一种在训练期间可以节省标注成本的方法，该方法通过点级别标注和目标可能性将对象指向强监督引入到CNN模型的训练损失函数中，可以明显提高模型的准确性。

Jun, 2015

基于图像级别监督学习像素级语义相似性用于弱监督语义分割

本文提出了一种用于弱监督下的图像标注的全新框架——AffinityNet。该框架通过训练一个深度神经网络，使其能够预测一对相邻图像坐标之间的语义亲和性，从而通过随机游走来实现语义的传播，以生成图像的分割标签。实验表明，使用我们的方法生成的分割标签训练的DNN，甚至比其它依赖于更强监管的模型表现更为优秀。

Mar, 2018

基于点监督的实例分割

该研究提出了一种只需要点级别注释来训练模型实现物体实例分割的方法，其通过建立一个具有两个分支（定位网络和嵌入网络）的网络，使用伪标签和相似嵌入方法来提高分割效果，在特定情况下，可以获得有竞争力的结果，并且是一种实例分割点级别监督的强基准线。

Jun, 2019

3D AffordanceNet：视觉物体可供性理解的基准测试

本论文介绍了一个名为 3D AffordanceNet 的数据集，其中包含来自 23 个语义对象类别的 23k 个形状，注释了 18 个视觉可用性类别，并提供了三个评估视觉可用性理解的基准测试任务。作者评估了三种最先进的点云深度学习网络，并研究了半监督学习设置探索利用未标记数据的可能性。综合结果表明，视觉可用性理解是一个有价值但具有挑战性的基准测试。

Mar, 2021

从注意力中学习关联性：利用Transformer进行端到端弱监督语义分割

本文介绍使用Transformer结合注意力机制来改善弱监督语义分割的问题，提出了Affinity from Attention和Pixel-Adaptive Refinement模块来学习和精华像素标签和相似度，本方法在多个数据集表现非常出色。

Mar, 2022

走向视觉功能学习：一个为功能分割和识别设定的基准

本文介绍了一个大规模多视角RGBD视觉可供性学习数据集及其基准测试方法，它包含了来自 37 种对象类别、配有 15 种视觉可供性类别和35 种杂乱/复杂的场景的 47210 个RGBD图像。我们提出了一个名为ARNet的【可供性识别网络】，证明了该数据集的挑战性以及提出的新的强大的可供性学习算法的明确前景。

Mar, 2022

LOCATE: 弱监督可支配定位与传输物体部件

本文提出一种名为LOCATE的框架，采用图像级别的适应性和对象标签对交互区域进行特征嵌入，并将其聚合为人类、对象部分和背景的紧凑原型之一，以指导功能接地的弱监督学习。对于新物体，实验证明我们的方法在训练图像和测试图像上性能都很好。

Mar, 2023

基于亲和传播的标签高效分割

利用标签效率的稀疏注释进行弱监督分割的研究越来越受到关注，以降低费力的像素级标注过程成本，而成对亲和建模技术在此任务中发挥了重要作用。本文将亲和建模作为亲和传播过程，提出了局部和全局成对亲和项，以生成准确的软伪标签，并开发了一种高效算法来显著降低计算成本。该方法可以方便地插入现有的分割网络。在三个典型的标签有效分割任务中进行的实验证明了所提方法的卓越性能。

Oct, 2023

PointSeg：基于基础模型的三维场景分割的非训练范式

PointSeg是一种新的无需训练的范例，借助现有的视觉基础模型来解决3D场景感知任务，并展示了令人印象深刻的分割性能。

Mar, 2024

分割物体可供性：可重复性与对尺度的敏感性

本研究探讨了视觉可供性分割领域中现有方法的可重复性问题，旨在解决由于实验设置不一致导致的比较不公。我们提出在两个单一物体场景下进行基准测试，并引入重新训练的Mask2Former架构，结果显示该模型在大多数测试集上表现最佳，且对尺度变化的敏感性较高。

Sep, 2024