Aug, 2023

ROSGPT_Vision:仅使用语言模型提示来指挥机器人

TL;DR通过使用语言模型提示,我们提出了新一代机器人可以通过使用机器人模态语言模型(MLM)单独独立地与特定的机器人模态进行通信。一个中央任务模态通过大型语言模型(LLM)中介整个通信过程以执行机器人任务。我们将这种新的机器人设计模式命名为 Prompting Robotic Modalities(PRM),并在一个新的机器人框架 ROSGPT_Vision 中应用了这种 PRM 设计模式。ROSGPT_Vision 通过仅使用两个提示(一个视觉提示和一个 LLM 提示)来执行机器人任务,实现了处理视觉数据、做出明智决策和自动执行操作的能力。