Dec, 2023

大规模视频生成预训练在视觉机器人操作中的应用

TL;DR通过大规模视频生成预训练,我们展示了基于语言条件的视觉机器人操作对于生成预训练模型的有效性扩展,提供了新的证据,显示出在多任务视觉机器人操作中,经过视频生成预训练的统一 GPT 风格转换器具有显著的泛化能力。