Jul, 2024

机器人控制通过体现链式思维推理

TL;DR通过在视觉语言行动模型的基础上引入具体问题和传感器观测,Embodied Chain-of-Thought Reasoning (ECoT)通过训练模型在推理计划、子任务、动作以及与视觉和运动相关的要素前,提高了机器人控制策略的性能和泛化能力。在没有额外机器人训练数据的情况下,ECoT相对于目前最强的开源机器人控制策略OpenVLA,显著提高绝对成功率28%,同时使人类更容易通过自然语言理解该策略的失败并进行纠正。