Oct, 2022

评估 3D 迷宫中的长期记忆

TL;DR本文介绍了 Memory Maze,这是一个专门设计用于评估智能体长期记忆的三维随机迷宫领域,包括在线的强化学习基准测试、离线数据集和离线探测评估。我们发现当前算法在小迷宫上的表现很好,但在大迷宫上还不及人类表现,未来有待进一步进行算法设计和评估。