Feb, 2019

Obstacle Tower: 视觉、控制和规划的泛化挑战

TL;DR该研究提出了新的人工智能基准测试环境——障碍塔,通过该环境智能体必须学会解决低级控制和高级规划问题,同时学习像素和稀疏奖励信号。除了评估环境外,还要评估智能体在未见环境中的表现,已有的深度强化学习方法和人类玩家的基线实验结果表明,这些算法无法产生接近人类水平的智能体。