COLINGMar, 2024

基于语义地图的导航指令生成

TL;DR我们提出了一种使用语义地图作为视觉输入的图像字幕任务的导航指令生成新方法,并发布了使用语义地图的指令生成基准数据集和初步模型。