Oct, 2022

DIAMBRA Arena: 强化学习新研究平台

TL;DR介绍了 DIAMBRA Arena 这个具有高质量环境和遵循 OpenAI Gym 标准 Python API 接口的新学习平台,它支持单人和多人模式,可用于标准的强化学习、多智能体、人工智能和人机协同学习等主题。利用 DIAMBRA Arena 成功地训练出多个深度强化学习智能体,可获得类似人类的行为。结果证实了 DIAMBRA Arena 作为一个研究工具的实用性,提供了设计用于研究该领域中一些最具挑战性主题的环境。