Mar, 2024

基于语言的单目深度估计的深度提示

TL;DR使用自然语言作为一种显示世界结构的显式先验的研究中,首先证明了语言模型在训练过程中编码了这种隐式偏差,并通过一个简单的学习方法进行提取。然后,通过一个供给 MDE 系统使用的现成实例分割模型提供标签作为语言模型输入的显式假设源。在 NYUD2 数据集上展示了我们方法的性能,并与基准线和随机对照进行了比较的改进。