May, 2019

Arena:多智能体智能评估平台和构建工具包

TL;DR介绍了一个名为 Arena 的多智能体通用评估平台,其中包含 35 个逻辑和表述多样的游戏,以及可视化的社会树和五种基本的多智能体奖励机制,为研究人员提供了一个易于发明和构建新的多智能体问题的建模工具包,还提供了五个最先进的深度多智能体强化学习基线的 Python 实现和一组我们可以使用不同的训练方案训练的每个游戏的 100 个最佳的代理 / 团队,作为评估群体表现的基础,以便研究人员可以在稳定和统一的标准下进行比较。