Nov, 2018

注意力多智能体DDPG模型中团队伙伴的动态联合策略建模

TL;DR本文提出了一种基于注意力机制的多智能体强化学习方法 ATT-MADDPG,通过采用集中式批判者和注意力机制来有效建模团队成员的动态政策,并在基准任务和实际任务中的实验结果证明了其性能优于现有的基于规则和强化学习的方法。