Oct, 2022

手掌向上:在潜在空间中进行无监督预训练游戏

TL;DR本文提出了一种深度生成模型的算法,结合静态数据集和动态模型,利用无监督的强化学习探索环境,在时间信息中进行表示学习,并成功地将学习到的表示迁移到视觉和强化学习任务中。