Mar, 2022

NeurIPS 2021 NetHack Challenge 的见解

TL;DR本文总结了第一次 NeurIPS 2021 NetHack Challenge 的主要论点,该挑战赛旨在使用强化学习或符号学习等方法开发一个程序或代理,与 NetHack 学习环境进行交互,以赢得这个迷宫探索游戏。结果表明,符号 AI 目前在 NetHack 中的表现远优于深度强化学习,并且没有代理成功通关游戏,NetHack 由此成为一个长期的 AI 研究基准。