Jul, 2021

分布式多智能体强化学习研究框架 Mava

TL;DR本文介绍了一种名为 Mava 的研究框架,它专门为构建可扩展的多智能体 RL 系统而设计。Mava 提供了有用的组件,抽象层,实用工具和通信模块,使得相应算法更容易复现和扩展,并且具备高度的灵活性和可组合性,同时实现具有良好扩展性的系统培训和执行,并在多智能体环境中进行分布式系统训练取得了良好的实验结果。