Nov, 2024

用于高效策略学习的预训练视觉动态表示

TL;DR本研究针对利用无标注视频数据进行强化学习预训练中的挑战,提出了一种名为预训练视觉动态表示(PVDR)的新方法。通过采用视频预测作为预训练任务,我们利用基于Transformer的条件变分自编码器(CVAE)学习视频中的视觉动态表示,从而有效缩小视频与下游任务之间的领域差距,促进政策学习的效率。实验结果表明,PVDR能够有效提升基于视频的预训练效果。