CVPRNov, 2017

视觉语言导航:在实际环境中解释基于视觉的导航指令

TL;DR通过视觉和语言方法的应用,本文提出了一个以真实影像为基础的强化学习环境 Matterport3D Simulator,为现实建筑物的自然语言导航问题提供了第一个基准测试数据集 Room-to-Room (R2R) dataset。