Feb, 2024

将知识图谱与视觉感知对齐,进行物体目标导航

TL;DR提出了一种将知识图谱与视觉感知对齐的方法,通过连续建模场景结构和利用视觉 - 语言预训练来实现更准确和一致的场景描述,从而提供了非凡的零样本导航能力。