May, 2023

基于Transformer模型的单目视觉里程计:一种视频理解方法

TL;DR利用基于自注意力机制的TSformer-VO模型,将单目视觉里程计作为视频理解任务,从视频片段中提取特征并通过端到端的方式估计摄像机的6-DoF位姿,取得了与基于几何和深度学习的方法相比具有竞争力的业内领先表现。