Apr, 2020

子任务感知的视觉语言导航

TL;DR本文提出了一个精细度更高的注释,以便在自然语言指令下更好地完成环境中的导航,为此使用了带有细致的注释的 Room-to-Room(R2R)基准数据集。并引入有效的子指令注意力和移位模块,在每个时间步选择并关注单个子指令,实现了此子指令模块,与四个最新的代理基线模型进行了比较,并展示了我们提出的方法改进了所有四个代理的性能。