Jun, 2019

Atari 中的无监督状态表示学习

TL;DR本论文提出了一种学习状态表示的方法,通过最大化观察神经编码器的空间和时间不同特征之间的相互信息来学习这些表示。此外,本文还介绍了一个基于 Atari 2600 游戏的新基准评估方法,用于评估它们能够捕捉地面真实状态变量的能力。我们相信这个新的评估框架会对未来的表示学习研究至关重要。最后,我们将我们的技术与其他最先进的生成和对比表示学习方法进行了比较。