MMDec, 2023

无监督结构光变换

TL;DR我们提出了一种基于鲁棒的 Transformer 的单目 SfM 方法,能够同时预测单目像素级深度、自车的平移和旋转、相机的焦距和主点,并且通过在 KITTI 和 DDAD 数据集上的实验,展示了如何适应不同的视觉 Transformer 并将其与当代基于 CNN 的方法进行比较。我们的研究表明,虽然基于 Transformer 的架构在运行时间效率上较低,但在面对自然的破坏、非目标攻击和有目标攻击时具有可比性的性能,并且更加稳健。