Dec, 2023

DL3DV-10K:用于基于深度学习的三维视觉的大规模场景数据集

TL;DR我们提出了一个大规模场景数据集 DL3DV-10K,其中包含了来自 10,510 个视频的 51.2 百万帧,涵盖了有界和无界场景的 65 种感兴趣位置 (POI),具有不同水平的反射、透明度和照明。我们在 DL3DV-10K 上对最新的 NVS 方法进行了全面的评估,为未来 NVS 研究提供了有价值的见解。此外,我们在从 DL3DV-10K 中学习可泛化 NeRF 的试点研究中取得了令人鼓舞的结果,这证明了大规模场景级数据集对于构建学习三维表示基础模型的必要性。我们的 DL3DV-10K 数据集、评估结果和模型将在此 https URL 上公开获取。