Oct, 2023

视频语言规划

TL;DR我们介绍了视频语言规划(VLP)算法,利用在互联网规模数据上预训练的大型生成模型,通过在生成视频和语言空间中进行可视化规划来完成复杂的长期任务,通过针对多模态(视频和语言)进行详细规划来描述如何完成最终任务,进一步通过目标条件策略将生成的视频转化为真实的机器人行动。