Oct, 2024

PIVOT-R:基于原语的目标点感知世界模型用于机器人操作

TL;DR本文解决了语言引导的机器人操作中,低级可执行动作与指令之间关系不明确的问题。提出的一种新的PIVOT-R模型通过重点预测任务相关的目标点,提高了机器人的操作性能和效率,实验证明其在SeaWave基准测试中相较于最先进开源模型有19.45%的平均提升,并且通过异步层次执行器大幅提高了执行效率。