Dec, 2020

从单张图片学习恢复三维场景形状

TL;DR研究探讨了在混合数据深度预测训练中使用的位移不变重建损失所引起的未知深度偏移及可能的未知相机焦距问题,并设计了一个两阶段框架以实现单目图像深度预测,并使用三维点云编码器预测遗漏的深度偏移和焦距以恢复逼真的 3D 场景形状,本文提出了图像级标准化回归损失和基于法向几何损失的方法,以增强用混合数据集训练的深度预测模型,该深度模型在 9 个不可见数据集上测试并取得了零样本数据集泛化的最新性能记录。