Mar, 2024

基于层次空间接近原理的视觉语言导航

TL;DR该论文提出了一种基于 Hierarchical Spatial Proximity Reasoning(HSPR)模型的视觉语言导航算法,通过引入 Scene Understanding Auxiliary Task(SUAT)来构建空间接近性知识库,利用 Multi-step Reasoning Navigation Algorithm(MRNA)进行路径规划,并通过引入 Proximity Adaptive Attention Module(PAAM)和 Residual Fusion Method(RFM)提高导航决策的准确性。实验证明了该方法的有效性。