- ICLR自监督对抗训练单目深度估计抵抗现实世界攻击
我们提出了一种新颖的自监督对抗训练方法,通过利用视图合成以增强单眼深度估计模型对真实世界攻击的对抗鲁棒性,而无需真实深度的地面真值。我们的方法在两个代表性的单眼深度估计网络上进行实验证明,相比于特别设计用于单眼深度估计的监督学习和对比学习方 - Flash3D:来自单幅图像的前馈式通用三维场景重建
提出了一种名为 Flash3D 的方法,用于从单个图像进行场景重建和新视角合成,具有很强的通用性和高效性。该方法基于基本模型进行深度估计,并使用高斯分层预测场景的 3D 形状和外观,利用高斯散点处理进行扩展。该方法训练效率高,在 RealE - 深度监督稀疏视角 3D 高斯下的不确定性导向最优输运
3D 高斯 splatting 在实时新视图合成中表现出令人印象深刻的性能。本论文提出了一种新颖的方法,利用具有集成不确定性估计的深度先验来监督 3D 高斯分布,以解决稀疏输入视图的挑战,并集成了一个基于补丁的最优运输策略来补充传统 L2 - GenWarp:语义保持生成器变形的单张图像到新视角
提出了一种新颖的方法,通过将 T2I 生成模型与单目深度估计相结合的生成扭曲框架,使 T2I 模型能够学习何时扭曲和何时生成,从而解决了从单张图像合成新视角时存在的限制,并在领域内外的场景中优于现有方法。
- 单目深度估计中无监督域自适应的一致性正则化
在单目深度估计中,我们提出了一种基于一致性的半监督学习方法来解决无监督领域自适应问题,通过在源领域的预测结果和未标记目标样本的多个增强视图上的扰动一致性来实现源领域的预测规则化。与先前的方法相比,我们的方法简单且有效,只需要训练单个模型,实 - 联合语义分割和单目深度估计中的多任务不确定性评估
本论文研究了多任务学习对不确定性估计质量的影响,并探索了在联合语义分割和单目深度估计上量化预测不确定性的方法。
- 无需相机姿态的稀疏视角合成的构造优化方法
通过利用 3D 高斯喷洒方法,我们开发了一种无需相机姿态的稀疏视图合成的新构建和优化方法,通过在构建过程中使用单目深度和将像素投影回 3D 世界来逐步构建解决方案,并通过检测训练视图与对应的渲染图像之间的 2D 对应关系,我们开发了一种统一 - 领域转移的合成数据生成用于提高单目深度估计
基于 3D 合成环境和 CycleGAN 域转换的数据生成方法与常见的 NYUDepth V2 数据集相比,通过使用不同的真实和模拟数据集训练基于 DenseDepth 结构的深度估计模型,我们评估了模型在新采集的图像和 Husky 机器人 - 去除神经辐射场中的深度先验
该论文研究了如何通过集成单目深度估计方法与 NeRF 模型,来显著降低时间消耗、提高场景生成和物体去除的鲁棒性和质量,并结合 KITTI 数据集验证了该方法的有效性。
- 隐形缝合:使用深度修复生成平滑的 3D 场景
基于 2D 生成扩散模型的进展,我们在三维场景生成领域做出两个基本贡献:首先,通过引入新型深度完成模型学习三维融合过程,提高场景的几何一致性;其次,基于真实几何关系引入新的场景生成方法基准系统,用于评估场景结构的质量。
- 跨架构知识蒸馏促进卷积神经网络在高效单目深度估计中的应用
提出了一种名为 DisDepth 的跨体系结构知识蒸馏方法,用于增强具有卷积结构的高效卷积神经网络模型的性能,并且通过教师模型传递有价值的信息以改进单目深度估计的准确性。
- CVPR自我监督单目深度估计中动态区域的挖掘监督
利用自我监督训练框架,将静态和动态区域的图像深度估计分离,通过伪深度标签改善动态场景的深度估计性能。
- 用于单目深度估计的虚拟增强 NYU 深度 V2 数据集:需要人工增强吗?
该研究中介绍了 ANYU,它是 NYU depth v2 数据集的一种扩展版本,通过将虚拟现实对象的 RGB-D 表示融合到原始图像中,提高了深度估计性能和深度神经网络的泛化能力。该研究是首次利用随机生成的虚拟 3D 对象扩增现实世界数据集 - CVPR关于低级视觉任务的语言指导的稳健性:深度估计的发现
最近的研究在单目深度估计方面取得了很大的进展,通过加入自然语言作为额外的指导获得了令人印象深刻的结果,然而,语言先验的影响尚未被探索,特别是在泛化性和鲁棒性方面,本文通过量化这一先验的影响,并引入方法来评估其在不同背景下的有效性,我们发现当 - 基于反射镜面先验的水景自监督单目深度估计
本文提出了一种基于自我监督的深度估计方法,通过利用水景中的镜面反射和几何约束,对单张图像进行深度估计。利用水分割网络将反射分离出来,然后通过自我监督框架从反射中预测目标的外观,以优化姿态和深度估计。此外,通过引入大规模虚拟场景数据集来减少真 - WorDepth: 变分语言先验对单目深度估计的应用
使用单个图像进行三维重建存在困难,使用单个图像与文本描述相结合可以提高度量标度重建性能。
- 边缘处藏魔鬼:具有边缘感知一致性融合的单目深度估计
本文提出了名为 ECFNet 的新型单目深度估计方法,通过单个 RGB 图像准确预测高质量的单目深度,应用了图像边缘信息和深度一致性模块来融合不同来源的初始深度,实现了领先的性能。
- 利用近场照明从内窥镜视频进行单目深度估计
本论文介绍了在内窥镜图像中利用光度线索提高单目深度估计的方法,并通过使用自监督和监督训练的方法,结合教师 - 学生迁移学习,实现了对内窥镜图像的高质量深度估计。
- 高效稳健的全局追踪
我们提出了一种新颖的测试时优化方法,可高效且鲁棒地跟踪视频中的任何像素。通过引入一种新颖的可逆形变网络 CaDeX ++,我们改进了效率和鲁棒性,并在架构设计中增加了更强的几何偏差,并利用视觉基础模型提供的归纳偏差。我们的系统利用单目深度估 - CVPR自主驾驶中对单目深度估计的物理三维对抗攻击
基于深度学习的单目深度估计 (MDE) 在自动驾驶中广泛应用,但容易受到对抗攻击。我们提出了第一个基于三维纹理的对抗攻击方法 3D$^2$Fool 来克服现有攻击方法的局限性,并在各种场景下取得了卓越性能的实验验证。