May, 2023

利用野外视频进行预训练的语境化世界模型,用于强化学习

TL;DR本文研究利用野外数据预训练 world models 来提高 model-based reinforcement learning 在多个领域的样本效率,并引入了一种名为 Contextualized World Models 的模型来解决野外数据的语境多样性问题。实验结果表明,使用带有 Contextualized World Models 的野外视频预训练可以显著提高机器人操作、运动和自动驾驶等多个领域内 MBRL 的样本效率。