Feb, 2024

PIVOT:迭代式视觉提示为 VLMs 引发可采取行动的知识

TL;DR提出一种名为 PIVOT 的新型视觉提示方法,将任务视为迭代式视觉问答,并探索其在机器人控制、空间推理等领域的应用,展示了在没有机器人训练数据的情况下,其能够实现零样本控制和在各种环境中进行导航等功能。