Nov, 2021

从地标生成基础导航说明: 少即是多

TL;DR本篇论文主要研究利用360度图像生成室内路线的导航指令,通过提取关键地标并用多语言图像-文本编码器进行泛化训练,在英语、印地语和特鲁古语语言环境下,MARKY-MT5系统可以提供与人类导航指令75%相近的娴熟指导,显示出较高的性能和应用价值。