Oct, 2023
语言模型作为零样本轨迹生成器
Language Models as Zero-Shot Trajectory Generators
TL;DR大型语言模型(LLMs)已经显示出在机器人方面作为高级规划器的潜力,但通常假设LLMs在低级轨迹规划方面不具备足够的知识。本文深入探讨了这个假设,研究了当LLM(GPT-4)只有对象检测和分割视觉模型的访问权限时,是否可以直接预测操作技能的密集序列的末端执行器姿态。我们研究了一个单一的任务无关提示在26个真实世界的基于语言的任务上的表现,比如“打开瓶盖”和“用海绵擦拭盘子”,并调查了这个提示中哪些设计选择是最有效的。我们的结论打破了LLMs在机器人领域的假设限制,首次揭示了LLMs确实具备在常见任务中理解低级机器人控制的能力,并且它们还可以检测到失败并相应地重新规划轨迹。