Dec, 2018

基于语义感知的注意力神经嵌入在基于图像的视觉定位中的应用

TL;DR提出了一种新的,综合了外观和语义信息的 2D VL 定位方法,该方法使用多模态线索生成稳健的嵌入向量,其中利用了场景的语义布局的不变性,并提出了一个基于深度学习的注重注意力的框架来指导嵌入向量生成的过程,在三个具有挑战性的本地化数据集上测试,平均绝对提高了 19%,并且通过对模型各个组件进行广泛研究,证明了语义信息和注意模块的贡献。