Sep, 2019

具备语言预训练和随机采样的稳健导航

TL;DR本文提出了两种有效方法来改善视觉和语言导航(VLN)挑战中的指令表示和动作解码问题,一是使用大规模预训练语言模型来学习更好的文本表示,二是提出一种随机采样方案来减小训练和测试中动作的差距,从而使智能体可以在长序列的动作解码过程中学习自我纠正,将两项技术结合,成功地在Room-to-Room基准测试中取得了新的最优性能,以路径长度加权的成功率指标提高了6%绝对值(47%—>53%)。