Jun, 2023

利用离线预训练状态转向转换器从视觉观察中学习

TL;DR本文提出了一种基于视觉观测的学习方法,使用两阶段的 State-to-Go (STG) Transformer 训练出内在奖励进行强化学习,实现了利用仅有视频数据解决视觉强化学习任务的潜力,并在 Atari 和 Minecraft 等数据集上表现出了比基线更好的性能。