Feb, 2024

OpenFMNav: 面向开放式、零样本物体导航的视觉语言基础模型

TL;DR我们提出了 OpenFMNav,一种基于开放集对象导航的零样本模型,通过利用大型语言模型和视觉语言模型的推理和泛化能力,能够理解自由形式的人类指令,并在各种环境中进行有效的零样本导航,通过对 HM3D ObjectNav 基准测试的广泛实验,证明了我们方法的有效性,并通过真实机器人演示验证了这种方法对真实环境的开放性和泛化能力。