Feb, 2023

离网 MARL: 一个数据集生成框架,具备合作离线多智能体强化学习基线

TL;DR该研究为填补离线多智能体强化学习(MARL)领域中缺乏标准基准和评估方法的空白,提出了一个名为 OG-MARL 的离线 MARL 数据集和算法框架,包括一套标准评估方案。OG-MARL 的数据集本质上是从在线 MARL 基准中生成的,具有复杂的动态、非静态性、局部可观察性、次优性和稀疏奖励等特征。