CVPRApr, 2023

EC^2: 基于体现控制的紧急通讯

TL;DR提出了一种名为 EC^2 的新颖方案,用于预训练视频语言表示以进行 few-shot embodied control,通过紧密结合视频细节的语义和自然语言结构的紧密联系,实现了代理在新环境中快速行动的目标。该方法在 Metaworld 和 Franka Kitchen 的实验基准中表现了显着的优势,超过了以前的对比学习方法的表现。此外,对提出的联合建模方法进行了定量和定性分析,并讨论了未来的研究方向。