Oct, 2020

Room-Across-Room: 多语言视觉语言导航与稠密的时空基础

TL;DR介绍了 Room-Across-Room(RxR),这是一个新的视觉语言导航(VLN)数据集,它是一个多语言(英语,印地语和泰卢固语)的数据集,强调语言在VLN中的作用,解决了路径中已知的偏差,并更多地引用可见实体。RxR的规模和细节大大扩展了对仿真的体现性语言代理的研究。