- 自主驾驶中基于自我监督学习的深度预测
自主驾驶中深度预测的挑战和应用的研究,使用单目自监督学习方法,提出了条件生成对抗网络以及一种基于变换器的刚性场景和未来深度预测方法,以及视频到视频深度映射模型,用于改进对环境几何和动态物体运动的理解和决策。
- 多视角 SAM 联合深度预测和语义分割
基于多视角立体视觉和基于 Transformer 的语义分割解码器的多任务方法在深度预测和分割预测方面呈现出相互的优势。
- JointNet:基于文本图像扩散的密集分布建模
介绍了 JointNet,一种用于建模图像和其他密集模态(例如深度图)联合分布的新型神经网络架构,并通过 RGBD 扩散作为示例以及广泛的实验证明了其在众多应用中的适用性,包括联合 RGBD 生成、密集深度预测、深度条件图像生成和一致的基于 - 内窥镜单目深度预测任务导向的领域差异减小
该研究提出了一种新方法来利用标记的合成数据和未标记的真实数据,以实现对结肠镜序列的更具弹性和准确的深度图预测。
- 使用伪深度和融合改进的神经辐射场
通过构建多尺度编码体积和提供多尺度几何信息给 NeRF 模型,本文在新颖视角合成和密集几何建模方面提出了一种先进行深度预测和辐射场重建,以使构建的体积尽可能接近场景中物体的表面和渲染的深度更准确,然后通过深度引导的邻域特征融合,提高点体积特 - RoboDepth 挑战:稳健深度估计方法和进展
这篇论文总结了 RoboDepth 挑战中的获胜解决方案,重点关注鲁棒的自监督和全监督深度估计,涉及了深度估计、挑战赛、深度预测、超分辨率和降噪等方面的创新设计。
- SimCol3D - 结肠镜检中的三维重建挑战
结直肠癌是世界上最常见的癌症之一。本文描述了 2022 年 EndoVis 挑战赛中的人工结直肠三维重建问题及其解决方案的研究成果,并展示了虚拟结直肠镜检查中深度预测问题的可靠解决方案,同时指出姿态估计问题仍然是一个待解决的研究方向。
- CVPR单图深度预测中的元优化提高模型泛化能力
该研究使用基于梯度的元学习方法,针对室内单张图像深度预测的泛化能力问题,提出了将每个 RGB-D 对作为元优化中的任务的精细化任务,通过元学习得到更好的先验,对于零样本交叉数据集推理具有更高的泛化性和准确性。
- FSNet: 为自主驾驶重新设计自监督单目深度估计以进行全尺度深度预测
研究提出了一种综合的自我监督框架,利用惯性测量得到的帧间姿势,在自动驾驶场景中准确预测深度,特别是引入了一种全尺度深度预测网络 FSNet,对现有自我监督模型进行了四项重要改进,证明了其潜力。
- 姿势约束用于一致的自监督单目深度和自我运动
引入了一组时间一致性损失,用以减少自监督单目深度估计中尺度混淆和时间不一致性,提高深度和自我运动预测的基础性能。
- UAMD-Net: 一种用于稠密深度补全的统一自适应多模态神经网络
提出了一种新的多模态神经网络 UAMD-Net,通过融合双目立体匹配和稀疏点云的弱约束进行深度完善,并使用新的训练策略 Modal-dropout 使得网络能够适应多种模态输入条件,该方法在 KITTI 深度完善基准测试中的实验表明其能够产 - ICCV基于置信度的深度和表面法向迭代求解器用于深度多视角立体视觉
介绍了一种基于深度学习的多视角立体匹配系统,采用一种新型求解器,通过优化基于本地平面假设的能量潜力,迭代地求解每个视角的深度图和法向量图,并监测由定制的置信度地图产生的效果。
- 高效神经辐射场用于交互式自由视点视频
本文提出了一种名为 ENeRF 的场景表示,用于快速创建交互式自由视点视频,并实现了深度预测和辐射场网络的联合学习,通过针对场景表面附近的点进行采样,从而显著提高了渲染速度。在多个基准测试中进行实验,结果表明我们的方法在表现上具有竞争力,同 - 3DVNet: 多视角深度预测和体积细化
3DVNet 是一种结合了先前基于深度和体积的 MVS 方法优点的新型多视图立体 (multi-view stereo) 深度预测方法,使用基于体积的三维卷积神经网络来对所有深度图进行操作,并能够学习有意义的场景级先验知识,其在深度预测和 - 稀疏辅助网络实现单目深度预测和补全
研究了如何从单个 RGB 图像中预测密集深度,并引入了新的 Sparse Auxiliary Networks 模块来同时执行深度预测和补全任务。在室内和室外数据集上的实验结果表明,该模块能够同时学习两个任务,并在深度预测方面取得重大进展。
- CVPRM3DSSD:单目 3D 单阶段物体检测器
本文提出了一个在特征对齐和非对称非局部注意力机制下的单目三维单级物体检测器 (M3DSSD),借助两步特征对齐来解决现有锚点法单目三维目标检测方法在特征匹配方面的缺陷,并提出了一种新的非对称非局部注意力块,实现更好的物体深度预测效果,并在 - 基于迭代几何神经网络和边缘感知精炼的联合深度和表面法线估计算法 GeoNet++
本文提出一个新的几何神经网络 GeoNet++,用于从单张图像中联合预测深度和表面法向图,并通过边缘感知提升预测质量。此网络可用于其他深度 / 法向预测框架中,提高了在 3D 重建应用领域的预测质量和像素级精度,并提出了高质量 3D 表面深 - CVPR使用 Plackett-Luce 模型的单目深度估计通过列表排序
本文提出了一种基于 Plackett-Luce(PL)模型和神经网络的排序深度预测算法,在零样本情况下对多个基准数据集进行了评估,相较于现有的排序和回归方法,表现出了更高的有效性。
- ECCV自我优化单目 SLAM 和深度预测的伪 RGB-D
本文提出一种基于 SLAM 和 CNNs 的结合框架,将 CNN-predicted depth 用于伪 RGB-D feature-based SLAM,同时将几何 SLAM 的 3D 场景结构和相机姿势注入到深度网络中,以实现更好的姿态 - CVPR自适应薄体积表示的深度立体匹配方法及其不确定性感知
提出了 UCS-Net,它使用 adaptive thin volumes 进行 multi-view stereo,ATV 使用 variance-based uncertainty estimates 构建,并分为三个阶段逐步细化深度以