Mar, 2023

Atari 游戏中部分可观测无监督表示学习

TL;DR本文提出了一种用于部分可观测状态的无监督状态表示学习方案,相比受监督学习的 ST-DIM 方法在 Atari 游戏中的表现提高了,平均准确率得分达到了约 66%,平均 F1 得分为约 64%。