May, 2023

使用不平衡的图谱进行状态表示学习

TL;DR本文提出了一种新的学习方法,利用不平衡的地图来提高自监督学习的效率,并在 AtariARI 基准测试中展示了其比现有算法具有更好的性能。