Aug, 2022

深度多智能体强化学习与混合动作空间的进一步探索

TL;DR本研究提出了两个基于集中式训练、分散式执行范式的深度多智能体软策略优化算法以解决混合行动空间问题,并在基本物理模拟和易于实现的多智能体环境下进行了实验验证并取得了良好的表现。