Jan, 2020

Retouchdown: 在StreetLearn中增添Touchdown,作为在街景中进行语言基础任务的可共享资源

TL;DR该研究发布了 Touchdown 数据集中所需的 29k 个原始街景全景照片,并提供了 Touchdown 任务的参考实现,利用这些街景全景照片可以有效地进行视觉与语言导航和空间描述解决。