Sep, 2023
记忆训练场:无尽回合中基于记忆的智能体面临的部分可观测挑战
Memory Gym: Partially Observable Challenges to Memory-Based Agents in Endless Episodes
Marco Pleines, Matthias Pallasch, Frank Zimmer, Mike Preuss
TL;DRMemory Gym 引入了一种独特的基准测试,旨在测试深度强化学习代理的能力,具体比较门控循环单元(GRU)和 Transformer-XL(TrXL)在记忆长序列、抵抗噪声和泛化能力方面的性能。