深度场网络用于多视角场景的通用表示

ECCVJul, 2022

深度场网络用于多视角场景的通用表示

Depth Field Networks for Generalizable Multi-view Scene Representation

Vitor Guizilini, Igor Vasiljevic, Jiading Fang, Rares Ambrus, Greg Shakhnarovich...

TL;DR提出了一种使用 Transformer 架构学习隐式多视图一致场景表示并引入一系列 3D 数据增强技术的方法来增加视角多样性的深度估计网络，同时介绍了引入视角合成作为辅助任务，该网络在不使用显式几何约束的情况下在立体和视频深度估计方面取得了最先进的结果，并在零样本领域泛化方面有了显著的提高。

Abstract

Modern 3d computer vision leverages learning to boost geometric reasoning, mapping image data to classical structures such as cost volumes or epipolar constraints to improve matching. These architectures are specialized according to the particular problem, and thus require significant

3d computer vision transformer architectures multi-view consistent scene representation view synthesis depth field networks

发现论文，激发创造

鲁棒的几何保持深度估计 - 使用可微分渲染

通过混合数据集训练模型，预测几何保持的深度，并通过渲染重建场景的新视图以及设计损失函数，促进不同视角下深度估计的一致性，实现了对领域特定尺度和平移系数的自主恢复，优于现有最先进方法的多个基准数据集。

Sep, 2023

用于单图像新视角合成的几何感知深度网络

本文提出了一种利用场景 3D 几何信息进行新视角生成的方法，通过学习区域感知几何转换网络实现输入图像到目标视角的变换，并在 KITTI 和 ScanNet 数据集上取得了优于现有方法的高质量生成效果。

Apr, 2018

VolumeFusion：基于深度学习的三维场景重建深度融合技术

本文介绍了一种利用深度神经网络复制传统的 local depth maps calculation 和 global depth maps fusion 两步骤框架，以改善对 3D 场景重建精度和可解释性的计算机视觉任务方法。此外，作者还提出了一种称为 PosedConv 的旋转不变的 3D 卷积核，用于提高从非常不同视角获取的图像之间的匹配效率。作者在 ScanNet 数据集上进行了大量实验证明提出的方法在深度神经网络和传统计算机视觉技术中具有竞争力。

Aug, 2021

使用场景先验的通用神经场进行三维重建

在高保真度 3D 场景重建方面，神经场的最新进展已经有了实质性的提升。然而，大多数现有方法为每个独立场景训练单独的神经网络，这不可扩展、低效且对有限视角下的结果不理想。本研究引入了训练可推广的神经场，将场景先验结合其中，从而更好地解决上述问题，并支持单张图像的新视角合成。

Sep, 2023

MVDepthNet: 实时多视角深度估计神经网络

本文提出 MVDepthNet，在多视图深度估计中编码多视图观察信息，并结合参考图像使用编码器 - 解码器网络生成深度图，并在单目密集映射系统中应用，实现了高效准确的深度图生成。

Jul, 2018

无监督卷积神经网络用于单视角深度估计：几何的拯救

本文提出了一种基于自编码器的无监督深度卷积神经网络学习框架，通过训练不需要预训练或注释的神经网络，为单视图深度预测提供了一种新的方法。

Mar, 2016

FineRecon: 深度感知前馈网络用于详细三维重建

本文介绍了三种有效的方法来改善基于内推法的三维重建的精度，分别为：分辨率无关的 TSDF 监督策略、使用多视角深度估计的深度引导策略和使用高分辨率图像特征的新颖体系结构。这些方法可以使三维重建更加精细准确。

Apr, 2023

FoVA-Depth: 面向场景视角无关的深度估计用于跨数据集泛化

我们提出了一种在大视场摄像机数据上训练立体深度估计模型的方法，并能够推广到具有更大视场的数据。我们通过将训练数据变换为规范的大视场表示，并进行扩充，使单个网络能够推理出各种类型的扭曲，从而展示了我们方法在室内外数据集上的强大泛化能力，而这在以前的方法中是不可能的。

Jan, 2024

聚焦模糊：连接深度估计合成与实际领域的差距

本文通过使用领域不变的虚焦模糊作为直接监督来解决数据驱动的深度估计方法在不训练场景外的概括能力问题，并利用置换不变卷积神经网络利用虚焦提示，通过不同焦点的图像差异训练模型，从而在合成数据集合和真实世界图像集合上取得了令人信服的泛化结果和最先进的深度预测。

May, 2020

双视：几何引导的深度估计

我们的方法通过在网络中添加最新的 3D 几何数据作为额外输入，结合之前的几何提示，利用深度和 3D 场景重建领域中的先前工作，实现了与实时交互速度相比达到最先进的深度估计和场景重建。

Jun, 2024