Sep, 2021

MiniHack the Planet:一个开放式强化学习研究的沙盒

TL;DRMiniHack 是一个强大的沙箱框架,用于设计新的深度强化学习(RL)测试环境,其中包含了丰富和复杂的以网格为基础的游戏 NetHack 的所有实体和环境动态,MiniHack 可以使用人类可读的描述语言或简单的 Python 接口来轻松地设计新的 RL 测试环境或整合现有的 RL 基准测试。