EMNLPOct, 2022

ULN:朝着未指定的视觉和语言导航方向发展

TL;DR介绍了一种基于多层次不确定指令下的视觉 - 语言导航(ULN)设置和相应的评估数据集,以提高导航任务的实用性。通过利用特定细节下的子网格(GSS)地面多级别的指令,结合利用 “Exploitation-to-Exploration (E2E)” 模块估计地面不确定性和导航代理进行多步先知探索,成功率较现有模型提高了约 10%。