Nov, 2023

审慎行事:揭示GPT-4V在机器人视觉语言规划中的能量

TL;DR我们介绍了一种名为Robotic Vision-Language Planning (ViLa)的新方法,该方法结合了视觉-语言模型和长期规划,通过直接整合感知数据来生成可行步骤序列,以在广泛的开放世界操纵任务中展示其优势。