Jul, 2024

使用视觉 - 语言模型进行四足机器人适应的常识推理

TL;DR通过利用视觉 - 语言模型(VLM)的通识推理能力,以及 VLM 在上下文适应和多技能规划方面的关键组件,我们提出了 VLM-Predictive Control(VLM-PC)系统,能够帮助双足机器人在处理困难、模糊的情况下做出自适应行为选择,从而使机器人能够在多样复杂的情景中自主感知、导航和行动,而无需环境特定的工程或人类引导。