Jul, 2020

人工智能竞争团队中异质策略的自然出现

TL;DR研究了多智能体策略在混合合作-竞争环境下的学习问题,提出使用图神经网络和强化学习联合训练的方法,并可以将其应用在异构多智能体行为的研究中。最终,提出了集合训练的算法,将对手 Agent 的策略融合到训练中,以提高团队的整体表现。