May, 2023

AlphaBlock:机器人操纵中视觉语言推理的具身微调

TL;DR提出了一个学习机器人操纵任务高级认知能力的新框架,使用语言模型构建AlphaBlock数据集,自动采集综合高级多步文本计划和配对观察序列,使用多模式的闭环计划模型自回归生成计划,从而实现对机器人的精细操作。实验结果表明,该方法显著提高了成功率。