Sep, 2023

语言扩展室内 SLAM(LEXIS):实时视觉场景理解的多功能系统

TL;DRLEXIS 是一种实时室内同时定位与地图构建系统,通过利用大规模语言模型的开放词汇特性,实现了场景理解和地点识别的统一方法。该系统通过建立环境的拓扑 SLAM 图,并将 CONTRASTIVE LANGUAGE-IMAGE PRETRAINING(CLIP)特征嵌入图节点,实现了灵活的房间分类和划分,并在房间为中心的地点识别方面取得了优于最先进技术的性能。