CVPRApr, 2022

基于 Transformer 的多帧自监督深度学习

TL;DR本研究提出了使用特征匹配和转换器架构进行单目自监督深度估计的新方法,通过使用深度离散化的极线采样选择匹配候选项,并通过一系列的自注意力和交叉注意力层来改进预测。该方法可以从视频中单独训练,从而建立自监督单目深度估计的最新技术,并具有一定的泛化性能.