Apr, 2024

GPT-4V 闭环开词汇库移动操作

TL;DR使用 GPT-4V 视觉语言基础模型的 CLOSE-robot 闭环框架,在开放环境中进行自主机器人导航和操作,通过多模态推理、生成动作策略、验证任务进展和提供反馈,实现了环境感知、情境推理和故障恢复,显著提升了任务成功率和故障恢复能力。