ICMLJun, 2020

基于图形策略学习的开放式即席团队合作

TL;DR本文提出建立一个自主代理,该代理可以在没有先前的协调机制的情况下快速适应以与队友合作的挑战性问题,包括联合培训,该解决方案基于图神经网络学习代理模型和不同团队组成下的联合行动价值模型,并提出了新的行动价值计算方法, 经实验证明,该方法成功地模拟了其他代理对学习器的影响,导致了可以稳健地适应动态团队组成并显着优于若干替代方法的策略。