多智能体团队学习的更深层理解

IJCAIJun, 2023

Towards a Better Understanding of Learning with Multiagent Teams

David Radke, Kate Larson, Tim Brecht, Kyle Tilbury

TL;DR研究团队结构在群体学习中的影响，结果显示，某些团队结构帮助代理程序学习特定角色，从而获得更有利的全局结果；然而，大型团队创建的信用分配挑战降低了协调性，导致大型团队表现不如小型团队。

Abstract

While it has long been recognized that a team of individual learning agents can be greater than the sum of its parts, recent work has shown that larger teams are not necessarily more effective than smaller ones. In this paper, we study why and under which conditions certain

team structures learning agents specialization credit assignment coordination

发现论文，激发创造

多智能体学习中团队合作的益处探究

本文提出了一种基于组织心理学和早期人工智能团队工作的新型强化学习智能体多智能体团队模型，验证结果表明，尽管有不合作的动机，代理分成团队后仍然能发展出合作的政策，能在团队内更好地协调和学习相应角色，并比所有代理利益一致时获得更高的回报。

May, 2022

学习在团队规模间转移角色分配

我们提出了一个基于角色的多智能体强化学习框架，该框架使用角色分配网络将学习代理分配到团队中，以适应不同的团队大小，并通过 StarCraft II 模拟来展示该方法的有效性。

Apr, 2022

多智能体团队中可迁移合作行为的学习

提出使用共享的代理 - 实体图来建模多智能体相互作用，并利用基于图的强化学习训练代理实现协作行为，实现了对多种任务的有效解决，并展示了其泛化能力。

Jun, 2019

基于任务关系建模的多智体策略迁移

本文提出了一种基于任务表示的团队适应方法，通过学习任务之间的共同结构，使得团队可以在少量的源任务学习之后将协作知识传递到新任务上。我们发现微调转移策略有助于解决那些从头开始难以学习的任务。

Mar, 2022

在多智能体环境中开发、评估和扩展学习智能体

DeepMind 的 “博弈论与多智能体团队” 研究了多智能体学习的多个方面，旨在使用深度强化学习探索复杂环境下的多智能体系统，并使用这些基准来推进我们的理解；本文总结了他们最近的工作并提出了一项分类，突显了多智能体研究中许多重要的开放性挑战。

Sep, 2022

多智能体强化学习中的协作课程学习

在多智能体环境中，通过使用降低技能水平的协作队友为学习代理制定学习课程，能够同时实现任务完成与整体团队奖励最优。

Dec, 2023

人工智能竞争团队中异质策略的自然出现

研究了多智能体策略在混合合作 - 竞争环境下的学习问题，提出使用图神经网络和强化学习联合训练的方法，并可以将其应用在异构多智能体行为的研究中。最终，提出了集合训练的算法，将对手 Agent 的策略融合到训练中，以提高团队的整体表现。

Jul, 2020

灵活的团队合作

提供代理工具以协调和沟通，通过 STEAM 构建团队，以探讨面临的不确定性，并在多个复杂领域中应用，实现降低团队沟通负担，提高团队协作效率的目的。

Sep, 1997

竞争中的协同涌现

通过引入具有连续模拟物理的具有挑战性的竞争性多智能体足球环境，我们研究了加强学习智能体中合作行为的出现。我们演示了分散、基于人口的联合训练能够导致代理行为的进步：从随机的行为到简单的球追逐，最终呈现出合作的迹象。我们进一步应用了一个由博弈论原理支持的评估方案，可以在没有预定义评估任务或人类基准的情况下评估代理的性能。

Feb, 2019

合作多智体强化学习中的教学学习

本文提出了一种新的算法，名为 Learning to Coordinate and Teach Reinforcement（LeCTR），通过在协作多智能体强化学习中使每个代理都学习何时提供何种建议，从而改善整个团队性能和学习效果。实证比较表明，我们的教学代理不仅学习速度更快，而且在现有方法失败的任务中也学会了协作。

May, 2018