本文提出了一种基于对抗学习框架的无监督深度学习方法,用于预测深度图,通过学习预测校准立体相机设置下两个图像视图之间的对应场,提出了一个有两个生成子网络的架构,它们通过对抗训练共同用于重建视差图并相互约束和监督。实验结果表明,该模型可以有效地解决深度估计任务。
Jul, 2018
自主驾驶中深度预测的挑战和应用的研究,使用单目自监督学习方法,提出了条件生成对抗网络以及一种基于变换器的刚性场景和未来深度预测方法,以及视频到视频深度映射模型,用于改进对环境几何和动态物体运动的理解和决策。
Mar, 2024
该研究提出了一种新的无监督网络系统用于视觉深度和自我运动估计:堆叠生成对抗网络 (SGANVO)。该系统由一堆 GAN 层组成,其中最底层估计深度和自我运动,而更高的层估计空间特征,并且由于在层之间使用了循环表示,可以捕捉时间动态。该方法在 KITTI 数据集上获得了更好或可比较的深度和自我运动估计结果。
Jun, 2019
该研究利用对抗训练方法实现单目深度估计,通过引入上下文感知的非局部损失函数,将深度值的预测作为一个整体进行惩罚,具有较好的性能表现。
Aug, 2018
本文提出了一种基于生成对抗网络的无监督学习框架,从未标记的 RGB 图像序列中预测场景的 6 自由度姿态相机运动和单目深度图,并在 KITTI 和 Cityscapes 数据集上给出了详细的定量和定性评估,结果表明该方法优于现有传统和无监督深度 VO 方法,提供更好的姿态估计和深度恢复结果。
Sep, 2018
使用深度神经网络进行图像生成任务以提取高级特征,进而估计视觉里程碑的深度和位姿,同时利用光流和循环神经网络以及生成对抗网络改进深度和位姿的估计精度。
Sep, 2023
本文提出了一种半监督对抗学习框架来解决当仅有有限数量的训练图像 - 深度对时,单目深度估计的问题,并在 NYUD v2 数据集上改进了大部分最先进的模型。
Aug, 2019
在自动驾驶车辆的背景下,本文重新审视视觉深度估计问题。我们提出了一种新颖的半监督学习方法来训练深度立体神经网络,并提出了一种包含机器学习的 argmax 层和定制运行时的体系结构,可在嵌入式 GPU 上运行一个较小版本的我们的 Stereo DNN。在 KITTI 2015 立体数据集上展示了有竞争力的结果。
Mar, 2018
使用基于深度学习的自监督学习方法,提出一种无需真实深度信息,使用深度估计器和可微的空间变换器的,适用于手术场景深度估计的深度学习框架。
May, 2017
本文提出了一种基于深度学习的方法,使用自监督几何学习从人脸视频中自动恢复精细的三维几何结构,并应用于生成高度逼真的人脸视频。
Mar, 2022