ACLJun, 2019

多模态图文导航中的视觉语言联系

TL;DR研究通过不同的模态,将指示性的语言指令用于虚拟环境导航中,发现使用不同模态对于所使用的 VLN 模型产生不同的影响,并提出使用专家模型集成不同模态信息以提高模型性能。