Sep, 2024

Open-Nav:探索开放源代码LLM在连续环境中零样本视觉和语言导航

TL;DR本研究解决了传统视觉和语言导航(VLN)方法依赖特定领域数据集的问题,提出了一种新颖的使用开放源代码LLM进行零样本导航的方式。通过空间-时间链式推理框架,Open-Nav能有效理解指令、估计进度并做出决策,实验结果表明其在模拟和真实环境中的表现与闭源LLM相媲美,具有广泛的应用潜力。