Jan, 2023

单目深度估计神经网络结构的普适性研究

TL;DR通过广泛实验,我们观察到 Transformer 模型表现出强的形状偏见,而 CNN 模型则表现出强的纹理偏见,并且发现纹理偏见的模型比形状偏见的模型在单目深度估计中表现更差,同时进行了各种背骨网络的密集消融研究,实验证明 CNN 和 Transformer 的内在局部性会引入纹理偏见和形状偏见。