Nov, 2023

审慎行事:揭示 GPT-4V 在机器人视觉语言规划中的能量

TL;DR我们介绍了一种名为 Robotic Vision-Language Planning (ViLa) 的新方法,该方法结合了视觉 - 语言模型和长期规划,通过直接整合感知数据来生成可行步骤序列,以在广泛的开放世界操纵任务中展示其优势。