Sep, 2023

记忆训练场:无尽回合中基于记忆的智能体面临的部分可观测挑战

TL;DRMemory Gym 引入了一种独特的基准测试,旨在测试深度强化学习代理的能力,具体比较门控循环单元(GRU)和 Transformer-XL(TrXL)在记忆长序列、抵抗噪声和泛化能力方面的性能。