Jul, 2024

可扩展室内场景的单目占据预测

TL;DR室内场景的相机三维占据预测在外部驾驶场景中近来引起了越来越多的关注,然而,在室内场景中的研究相对较少。这篇论文中,我们提出了一种名为ISO的新方法,用于使用单目图像预测室内场景的占据情况。ISO利用预训练的深度模型的优势来实现准确的深度预测。此外,我们在ISO中引入了双特征视线投影(D-FLoSP)模块,增强了三维体素特征的学习。为了促进该领域的进一步研究,我们介绍了Occ-ScanNet,一个用于室内场景的大规模占据基准。它的数据集大小比NYUv2数据集大40倍,为未来的可扩展室内场景分析研究提供了便利。在NYUv2和Occ-ScanNet上的实验结果表明,我们的方法达到了最先进的性能。数据集和代码已在此URL公开。