Mar, 2023

机器人导航的音视频语言地图

TL;DR提出了一种名为 Audio-Visual-Language Maps (AVLMaps) 的 3D 空间地图表达方式,集成了来自音频、视觉和语言提示的跨模态信息,可以通过多模态引导实现零样本多模态目标导航,并在模糊场景中提供 50%更好的召回率。