Aug, 2020

QPLEX: 双工 Dueling 多智能体 Q 学习

TL;DR本文介绍了一种称为 duPLEX Dueling 多智能体 Q 学习的新型 MARL 方法,该方法利用 duplex dueling 网络结构对联合价值函数进行分解,以实现高效的价值函数学习,应用于 StarCraft II 微管理任务的经验实验表明,QPLEX 明显优于现有的基线算法,具有较高的样本效率和可以从离线数据集中获益的特点。