Mar, 2022

基于 POMDP 的 Atari 掩码深度强化学习基准

TL;DR介绍了基于 Atari 2600 游戏构建的模拟环境 Mask Atari,该环境为解决部分可观察强化学习问题提供了具有挑战性且有效的基准,并通过引入人类视觉系统的感受野,对移动物体可学习掩膜的敏感性进行了评估。