像素目标性
本研究提出了一种基于卷积神经网络的模型,只利用物体类别信息,通过最小化对目标分割任务的先验仅推断目标分割。我们展示了该模型在相对于弱监督物体分割任务中领先于业界最先进的方法。
Nov, 2014
本研究介绍了一种新的学习目标,用于训练深度神经网络执行端对端的图像像素聚类,该方法已应用于实例分割,其结果是出色的,并且在 2017 CVPR 自动驾驶挑战的车道检测竞赛中获得第二名,而在不使用外部数据的情况下是最优表现者。
Mar, 2018
该研究致力于解决在给定用户注释指向感兴趣的物体的情况下的视频对象分割问题。作者提出了一种基于学习嵌入空间的像素级检索方法,并使用全卷积网络作为嵌入模型,使用修改后的三元组损失进行训练。作者提出的方法支持不同类型的用户输入,如在第一帧中的分割遮罩(半监督情况下),或者一个稀疏的点击点集合(交互情况下),并在计算成本上获得了很好的结果。在半监督场景中,该方法达到了与现有技术相比竞争性的结果,但计算成本仅为每帧 275 毫秒。在交互式场景中,该方法能够实时响应用户的每个输入,并达到了与竞争方法相当的质量,但交互程度要少得多。
Apr, 2018
本文提出了基于 CNN 的视频对象分割算法,采用像素级匹配来区分目标区域和背景。提出了特征压缩技术,对大数据集进行实验,证明了模型在准确性、速度和稳定性方面的有效性,同时也介绍了模型在不同领域的可传递性。
Aug, 2017
本文旨在通过采用对比优化目标中的预定中级先验,引入了一个两步框架来学习像素嵌入,从而解决了计算机视觉中的无监督语义表示学习问题,并证明此方法优于现有方法。
Feb, 2021
本文提出了一个像素级聚类框架,用于将图像分割成区域,而无需使用地面真值标注。该框架包括特征嵌入模块、特征统计计算模块、图像重建和超像素分割,以实现准确的无监督分割。此外,我们提出了一种训练策略,利用每个超像素内部一致性、相邻超像素间的相似性 / 差异性和图像结构相似性。我们还提出了一种后处理方法,以避免由基于超像素的损失引起的过分分割。最后,我们扩展了所提方法用于无监督语义分割。通过在三个公开数据集上进行实验,我们证明了所提框架的有效性。实验结果表明,所提框架优于先前的最先进方法。
Oct, 2023
该研究提出了一种只需要点级别注释来训练模型实现物体实例分割的方法,其通过建立一个具有两个分支(定位网络和嵌入网络)的网络,使用伪标签和相似嵌入方法来提高分割效果,在特定情况下,可以获得有竞争力的结果,并且是一种实例分割点级别监督的强基准线。
Jun, 2019
本文提出了一种利用自顶向下的细化方法增强前馈网络进行物体分割的方法,命名为 SharpMask。该方法构建在 DeepMask 网络的基础之上,不同于当前 skip connection 的输出方法,SharpMask 通过在前馈传递中首先输出一个粗糙的 “掩码编码”,然后再自顶向下利用不断降低的层面上的特征进一步细化这个编码,获得高保真的物体掩码,能够比 DeepMask 在多种环境中提高 10-20% 的平均召回率并且速度更快(每张图片不到 0.8 秒)。
Mar, 2016