BriefGPT.xyz
Ask
alpha
关键词
multimodal specifications
搜索结果 - 1
视频语言规划
我们介绍了视频语言规划(VLP)算法,利用在互联网规模数据上预训练的大型生成模型,通过在生成视频和语言空间中进行可视化规划来完成复杂的长期任务,通过针对多模态(视频和语言)进行详细规划来描述如何完成最终任务,进一步通过目标条件策略将生成的视
→
PDF
9 months ago
Prev
Next