Dec, 2022

BEVBert: 基于拓扑度量图的语言引导导航预训练

TL;DR本研究提出采用混合拓扑度量图来实现视觉和语言导航,其中拓扑地图用于长期规划,度量地图用于短期推理,通过深度特征和预训练框架学习语言信息地图表示,增强了跨模态接地和促进最终的语言引导导航目标,实验证明了地图路线在VLN中的有效性,该方法在三个VLN基准测试中取得了最新的最佳效果。