Sep, 2024

用于深度视觉惯性里程计的因果变换器融合与位姿估计

TL;DR本研究针对深度视觉惯性里程计中位姿估计精度不足的问题,提出了一种因果视觉惯性融合变换器(VIFT)。该方法通过利用变换器的注意力机制来更好地利用历史数据,从而改善位姿估计的准确性,实验结果表明,VIFT在KITTI数据集上相较于传统方法显著提高了单目视觉惯性网络的精度。