BriefGPT.xyz
Ask
alpha
关键词
multimodal navigation
搜索结果 - 1
机器人导航的音视频语言地图
提出了一种名为 Audio-Visual-Language Maps (AVLMaps) 的 3D 空间地图表达方式,集成了来自音频、视觉和语言提示的跨模态信息,可以通过多模态引导实现零样本多模态目标导航,并在模糊场景中提供 50%更好的召
→
PDF
a year ago
Prev
Next