Mar, 2019

具有离散 - 连续混合动作空间的深度多智体强化学习

TL;DR本篇论文针对协同多智能体问题中的 “离散 - 连续混合动作空间” 这一实际难题,提出了两个新算法:Deep Multi-Agent Parameterized Q-Networks(Deep MAPQN)和 Deep Multi-Agent Hierarchical Hybrid Q-Networks(Deep MAHHQN)。中心化训练,分散执行范例下的实证结果显示,Deep MAPQN 和 Deep MAHHQN 均更为有效,且远胜于现有独立深度参数化 Q 学习方法。