ECCVJul, 2022

深度场网络用于多视角场景的通用表示

TL;DR提出了一种使用 Transformer 架构学习隐式多视图一致场景表示并引入一系列 3D 数据增强技术的方法来增加视角多样性的深度估计网络,同时介绍了引入视角合成作为辅助任务,该网络在不使用显式几何约束的情况下在立体和视频深度估计方面取得了最先进的结果, 并在零样本领域泛化方面有了显著的提高。