Jul, 2022

使用大型预训练的语言、视觉和行为模型的机器人导航

TL;DRLM-Nav是一个基于预训练模型的系统,它可以在大型未注释数据集上进行训练,不需要任何细化或语言注释的机器人数据,通过预先训练的导航模型(ViNG),图像语言关联(CLIP)和语言建模(GPT-3),可以通过自然语言指令在复杂的户外环境中漫游。