运动监督下的协同分割

Apr, 2020

Motion-supervised Co-Part Segmentation

Aliaksandr Siarohin, Subhankar Roy, Stéphane Lathuilière, Sergey Tulyakov, Elisa Ricci...

TL;DR提出了一种自我监督深度学习方法用于共同部分分割，通过挖掘从视频中推断出的运动信息，该方法能够产生比以前的自监督共同部分分割方法更好的分割地图。

Abstract

Recent co-part segmentation methods mostly operate in a supervised learning setting, which requires a large amount of annotated data for training. To overcome this limitation, we propose a self-supervised deep learning<

co-part segmentation self-supervised deep learning motion information video sequences segmentation maps

发现论文，激发创造

SCOPS: 自监督联合分割

本文提出了自监督深度学习方法，通过多种损失函数使分割结果既有几何的聚焦性，又能在不同物体实例之间保持语义一致性，实现即将物体分割的任务。研究表明，与现有的自监督技术相比，该方法能够产生更具语义一致性的分段，并且紧贴物体边界。

May, 2019

预测可能的运动模式进行无监督的多目标分割

该论文提出了一种新的无需人工干预的多物体图像分割方法，该方法可以从静止图像中提取物体，但使用视频进行监督学习，其关键洞察是预测可能包含运动模式的图像区域，超越了测试时间使用运动的方法，在模拟和真实世界基准上显示出最先进的无监督目标分割性能。

Oct, 2022

通过运动分组的自监督视频目标分割

本研究介绍了一种基于运动线索的分割方法，使用 Transformer 网络结构，采用自我监督的方法进行训练，结果在公共基准测试中表现优异，证明在现有视频分割模型中，对于运动线索的重要性，以及对视觉外观存在潜在偏差的可能性。

Apr, 2021

视频中的自监督物体运动和深度估计

本文提出了一种自监督学习框架，从视频中估算单个对象的运动和单眼深度，并将对象运动建模为六个自由度刚体变换；此外，该方法还使用实例分割掩码引入对象信息，并通过引入新的几何约束损失项消除运动预测的尺度歧义，实验结果表明，该框架在不需要外部注释的情况下处理数据并能够捕捉对象的运动，与自监督研究方法相比，在 3D 场景流预测方面有更好的表现，对动态区域的视差预测也有所贡献。

Dec, 2019

半弱监督的物体动力学运动预测

本文提出了一种基于图神经网络的半弱监督方法，用于解决 3D 物体动力学运动预测问题，通过对分层部分级别分割和移动部分参数之间的映射学习，在 PartNet-Mobility 数据集上进行训练，可以得到一批带有假标签的移动性信息的 3D 对象数据，并且可以进一步用于预先存在的分割的弱监督学习。

Mar, 2023

视频的自监督目标中心学习

本文提出了第一个完全无监督的方法，用于在真实场景的序列中分割多个对象，通过空间绑定对象并将这些槽联系起来，在高级语义特征空间中重建中间帧，解决了效率和规范化问题，成功地在 YouTube 视频中分割了复杂且多变的类别的多个实例。

Oct, 2023

学习移动物体的分割

本文提出了一种基于神经网络的视频分割方法，用于区分视频帧中独立运动的物体，并利用对象运动、外观和时间一致性等多个信息源，通过对数据进行训练得到模型，经过评估表明该模型在 DAVIS、Freiburg-Berkeley 运动分割数据集和 SegTrack 等数据集上表现良好。

Dec, 2017

LOCATE：基于流引导图割和自主引导自训练的自监督目标发现

利用动态信息和外观信息，我们提出了一种自我监督的目标发现方法，该方法能够生成高质量的目标分割遮罩，并在多个基准测试中取得与现有方法相媲美甚至超越的结果。

Aug, 2023

通过观察物体运动学习特征

本文介绍了一种基于无监督学习的视觉特征提取方法，采用运动分割技术自动从视频中得到图像分割信息进行卷积神经网络训练，结果在涉及少量目标训练样本的场景下显著优于现有无监督学习方法。

Dec, 2016

自监督学习目标部分应用于语义分割

本文介绍了以往自我监督的学习方式大多聚焦于图像级的表示学习，不能为无监督图像分割等需要空间多样的表示的任务带来改进，通过自我监督学习物体部件提出了新的解决途径，并结合目前趋势的 Vision Transformer，利用稠密聚类任务进行空间标记的微调，取得了在语义分割基准测试上超过 17%-3% 的最先进结果，且在完全无监督分割方面也具有重大潜力。

Apr, 2022