光流提升无监督定位和分割

Jul, 2023

Optical Flow boosts Unsupervised Localization and Segmentation

Xinyu Zhang, Abdeslam Boularias

TL;DR无标注图像分割和定位是自主机器人学习将图像解析为个体对象的关键能力，本研究提出了一种新的损失函数，利用无标注视频中的光流信息辅助自我监督视觉转换器的特征优化，实现了无标注语义分割的优于现有技术的性能。

Abstract

unsupervised localization and segmentation are long-standing robot vision challenges that describe the critical ability for an autonomous robot

unsupervised localization segmentation autonomous robot self-supervised vision transformers motion cues

发现论文，激发创造

通过运动分组的自监督视频目标分割

本研究介绍了一种基于运动线索的分割方法，使用 Transformer 网络结构，采用自我监督的方法进行训练，结果在公共基准测试中表现优异，证明在现有视频分割模型中，对于运动线索的重要性，以及对视觉外观存在潜在偏差的可能性。

Apr, 2021

类比学习：基于变换的可靠监督用于无监督光流估计

本文提出了一种使用变换提供的可靠监督信息的框架，通过使用数据增强技术来运行另一个向前传递的过程，并使用原始数据的转换后的预测结果作为自我监督信号，从而得到了多帧轻量级网络的最佳精度。

Mar, 2020

利用时间动态建模在多帧动态环境中进行无监督光流学习

本文提出了一种基于时空动态模型的无监督光流估计方法，使用视图合成的自我监督学习来提供可靠的运动先验信息，利用邻帧的运动先验来改善光流估计中遮挡区域的监督，采用自我监督知识蒸馏来让模型理解物体在连续动态环境中的运动模式，实验证明该方法在无监督光流估计中取得了最先进的性能并具有记忆开销优势。

Apr, 2023

对无监督手术器械分割中低质量光流的重新思考

通过我们的方法，在低质量光流的困境下，从光流直接提取边界、选择性地丢弃质量较差的帧，并使用可变帧率的微调过程，我们在 EndoVis2017 VOS 数据集和 Endovis2017 Challenge 数据集上展现了有希望的结果，分别达到了 0.75 和 0.72 的平均交并比。我们的研究结果表明，我们的方法可以大大减少临床环境中手动标注的需求，并可能促进新数据集的注释过程。

Mar, 2024

自我监督学习的跨像素光流相似度

采用动态光流来监督静态图像的表示，通过学习嵌入像素以达到其光流向量之间的相似性，我们设计了一种无需手工标注的学习卷积神经图像表示的新方法，这个新方法优于以往的运用动态光流学习卷积神经网络的方法，并在语义分割等领域首屈一指。

Jul, 2018

预测运动的非监督视频和图像分割

本文提出一种融合基于运动和外观的分割方法，利用预测简单运动模式区域对图像分割网络进行监督，使其具备检测和学习静止物体的能力。通过实验发现该方法不仅在无监督视频分割领域表现出色，而且能够适用于包含新颖物体的静态图像分割领域，同时还能够处理多种运动模型和光流基准的影响。

May, 2022

具备遮挡感知的光流无监督学习

本文研究了卷积神经网络在无监督学习下学习光流预测的能力；提出了一种新的模型来显式模拟遮挡问题，并使用新颖的变换方式来更好地学习大运动；在 Flying Chairs，MPI-Sintel 和 KITTI 标准数据集上进行了测试，结果表明在 KITTI 数据集上无监督方法的效果优于有监督方法，尤其在该数据集上，我们的方法表现出色。

Nov, 2017

无监督光流中的关键因素

本研究通过分析光流的关键组件如光度损失、遮挡处理和光流平滑正则化，提出了多种类似代价体积规范化、在遮挡掩模处停止梯度、在上采样光流场之前鼓励平滑等方法的优化，结合改进后的组件提出了一种新型的无监督光流技术，该技术不仅在 KITTI 2015 数据集上表现出色，而且比现有方法更为简单。

Jun, 2020

UnFlow: 双向 Census 损失的光流无监督学习

本研究提出一种利用基于能量的方法进行光流估计的无监督学习方法以替代对真实场景难以获得的像素精确度地面实况数据的依赖，此方法在 KITTI 基准测试中的表现优于以往的无监督深度网络，甚至比仅在合成数据集上进行训练的类似监督方法更准确，在 KITTI 2012 和 2015 基准测试中具有竞争优势。

Nov, 2017

基于语义分割和局部层的光流

利用静态语义场景分割技术提高光流方法中对于不同物体运动的预测准确度，并通过引入局部化分层模型来解决在复杂场景中估算光流的问题，达到了 KITTI-2015 流量基准测试中最低误差和更好的分割效果及流畅度。

Mar, 2016