Jul, 2020

自我预测表示法的数据有效强化学习

TL;DR本文提出了自回归表示(Self-Predictive Representations, SPR)方法,使用深度强化学习方法,并结合自监督目标和对视觉输入和与环境的交互结构的预测,提高了代理器的学习效率,并在Atari游戏中显著提高了性能。