有效选择高概率正特征实现视频中的无监督物体分割
本文提出了第一个完全无监督的方法,用于在真实场景的序列中分割多个对象,通过空间绑定对象并将这些槽联系起来,在高级语义特征空间中重建中间帧,解决了效率和规范化问题,成功地在 YouTube 视频中分割了复杂且多变的类别的多个实例。
Oct, 2023
本研究致力于解决视觉数据无监督学习中的目标检测问题,使用包含深度神经网络的学生路径来训练模型,该模型可以在测试时明显优于无监督视频发现教师,并在 YouTube 视频数据集和目标发现数据集等基准测试中取得了最先进的结果,测试时比其他方法至少快两个数量级。
Mar, 2017
本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图,用于解决快速运动,运动模糊和遮挡等视频分割的挑战,在 DAVIS,SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。
Sep, 2018
该研究提出了一种新颖的无监督视频多目标分割方法,通过结合前景区域估计和实例分组来提高实例判别,引入判别性外观模型用于目标跟踪,实现更准确的物体发现,以及采用自适应内存更新等三种策略提高分割准确性和推理速度,并在 DAVIS17 和 YouTube-VIS 数据集上超越了现有技术的表现。
Apr, 2021
该论文提出了一种新的无需人工干预的多物体图像分割方法,该方法可以从静止图像中提取物体,但使用视频进行监督学习,其关键洞察是预测可能包含运动模式的图像区域,超越了测试时间使用运动的方法,在模拟和真实世界基准上显示出最先进的无监督目标分割性能。
Oct, 2022
本文提出了一种新的框架,将视频 / 图像分割和区域定位视为一个单一的优化问题,并以非常弱的监督方式集成低级外观线索和高级定位线索的信息。该框架利用不同级别的两种表示,利用边界框和超像素之间的空间关系作为线性约束,同时在边界框和超像素级别上区分前景和背景。与以往主要依赖于判别聚类的方法不同,我们结合了一个前景模型,使得一个物体在所有图像帧中的直方图差异最小。利用超像素和边界框之间的几何关系使得分割线索可以传递以改善定位输出,反之亦然。前景模型的引入将我们的判别框架推广到视频数据,其中背景往往是相似的,因此不具有判别力。我们证明了我们的统一框架在 YouTube 对象视频数据集,Internet 对象发现数据集和 Pascal VOC 2007 上的有效性。
Nov, 2018
本文提出一种融合基于运动和外观的分割方法,利用预测简单运动模式区域对图像分割网络进行监督,使其具备检测和学习静止物体的能力。通过实验发现该方法不仅在无监督视频分割领域表现出色,而且能够适用于包含新颖物体的静态图像分割领域,同时还能够处理多种运动模型和光流基准的影响。
May, 2022
该论文提出了一个自超视自学的物体分割系统,其训练过程利用了点云的超分割结果,利用图匹配算法和点云配准结合检测出 3D 假标签上的再现物体模式并生成 2D 掩码。实验证明,该方法在真实和合成的视频数据集上的表现优于现有的无监督方法。
Apr, 2023
本文研究了严格无监督视频对象分割的问题,利用一种 John Tukey 启发式的 ' 异常度量 ' 方法从低级别的视觉数据中找到前景对象以及估计每个数据来源的可靠性。在各种视频特性变化的情况下,该方法取得了在 DAVIS 数据集上的最先进结果,并使用 Tukey-inspired 的方法对多种分割方法进行联合,其中包括使用训练,运行时或两者的监督的分割方法,这种方法相对更加稳健,将分割方法的 Jaccard 度量提高了高达 28%。
Nov, 2018
本研究介绍了一种基于运动线索的分割方法,使用 Transformer 网络结构,采用自我监督的方法进行训练,结果在公共基准测试中表现优异,证明在现有视频分割模型中,对于运动线索的重要性,以及对视觉外观存在潜在偏差的可能性。
Apr, 2021