Sep, 2024

GRIN:基于像素级扩散的零-shot度量深度估计

TL;DR本研究解决了从单幅图像进行3D重建时存在的尺度模糊问题,提出了一种名为GRIN的高效扩散模型,能够处理稀疏无结构的训练数据。通过在扩散过程中结合图像特征与3D几何位置编码,该方法在跨八个室内外数据集实验中展示了新的零-shot标准单目深度估计的最佳性能,具有重要的潜在应用价值。