Nov, 2023
审慎行事:揭示 GPT-4V 在机器人视觉语言规划中的能量
Look Before You Leap: Unveiling the Power of GPT-4V in Robotic Vision-Language Planning
Yingdong Hu, Fanqi Lin, Tong Zhang, Li Yi, Yang Gao
TL;DR我们介绍了一种名为 Robotic Vision-Language Planning (ViLa) 的新方法,该方法结合了视觉 - 语言模型和长期规划,通过直接整合感知数据来生成可行步骤序列,以在广泛的开放世界操纵任务中展示其优势。