通过观看双目视频联合无监督学习光流和深度

AAAIOct, 2018

通过观看双目视频联合无监督学习光流和深度

Joint Unsupervised Learning of Optical Flow and Depth by Watching Stereo Videos

Yang Wang, Zhenheng Yang, Peng Wang, Yi Yang, Chenxu Luo...

TL;DR本文研究利用深度神经网络观看视频，通过利用立体视频中的几何规则共同解决深度和光流两个任务。实验证明，我们的结果明显优于其他现有算法。

Abstract

Learning depth and optical flow via deep neural networks by watching videos has made significant progress recently. In this paper, we join

deep neural networks stereo videos optical flow depth ego-motion

发现论文，激发创造

视频中深度和自运动的无监督学习

本文提出了一种无监督学习框架，通过使用视图合成作为监督信号，同时训练深度和相机位姿估计网络以完成从非结构化视频序列中的单目深度和相机运动估计的任务。经验评估表明，我们的方法具备与基于监督方法使用地面真值位姿或深度进行训练的方法相当的单目深度估计能力，并且在相似的输入设置下，姿态估计表现良好。

Apr, 2017

UFD-PRiME: 通过像素级刚体运动估计进行光流和立体深度的无监督联合学习

用联合训练的方式估计光流与视差，进而获取更精细的遮挡与物体边界，同时估计动态物体的刚体运动。

Oct, 2023

DF-Net: 无监督联合学习深度和光流，使用交任务一致性

这篇论文提出了一种利用几何一致性作为监督信号的无监督学习框架，可以同时训练单视角深度预测和光流估计模型，在训练过程中，所有网络均进行联合优化，在测试时可以单独应用，实验证明该方法与现有的无监督方法相比具有竞争优势。

Sep, 2018

从立体视频中学习残差流作为动态运动

通过无监督学习框架，我们提出了一种将运动立体相机观察到的 3D 场景流分解为静止场景元素和动态物体运动的方法。我们利用三个协同工作的网络来预测立体匹配、相机运动和残留流，并明确估计基于残留流和场景深度的动态物体的 3D 场景流。在 KITTI 数据集上的实验表明，我们的方法在光流和视觉里程计任务上优于其他现有算法。

Sep, 2019

基于 Flow-Motion 和深度网络的单目立体视觉及其应用

本研究提出了一种基于学习的单眼立体视觉方法，可扩展到多个目标帧的深度信息融合，具有优秀的精度和效率。

Sep, 2019

动态物体的联合自监督深度和光流估计

本研究提出了一种基于深度学习的深度估计方法，通过将光流信息与深度估计相结合，在预测不同运动情况下的深度时减小像素包裹误差和光学向量，利用自我监督深度估计方法对不同运动区域进行独立估计并组合为完整的深度，能够比 KITTI Depth 数据集上的现有深度估计器表现更好，同时在 KITTI Flow 2015 数据集上也达到了竞争性的光流性能。

Sep, 2023

使用三维几何约束从单 ocular 视频中无监督学习深度和自我运动

提出了一种新颖的无监督学习深度和自我运动的方法，它主要基于对场景的推断 3D 几何形状进行对齐，并与基于光度学营养和有效性掩模的 2D 损失相结合，最终得出在 KITTI 数据集上的优越结果。

Feb, 2018

从单目视频中无监督学习深度、相机姿态和光流

DFPNet 是一种联合学习系统，通过单眼图像序列估计单眼景深、光流和自身运动（相机姿态），使用单一的复合损失函数进行训练，并使用超参数调整来使模型的大小小于目前市场上同类模型的 5％以下。在 KITTI 和 Cityscapes 驾驶数据集上进行评估，结果表明我们的模型在所有三个任务上的表现都可以媲美目前市场上同类模型的表现，即使模型大小明显更小。

May, 2022

使用双层优化进行光流和自我运动的联合无监督学习

利用几何约束将光流和相机运动估计问题融合为一个双层优化问题，进一步优化了基于无监督深度学习框架的光流估计和相机运动估计的质量，相较于其他无监督学习方法，获得了更好的结果。

Feb, 2020

基于光流和伪深度图的密集单目运动分割：一种零样本方法

我们提出了一种创新的混合方法，既利用深度学习方法又利用基于光流的传统方法来进行密集运动分割，而无需进行任何训练。

Jun, 2024