多智能体学习中团队合作的益处探究

IJCAIMay, 2022

多智能体学习中团队合作的益处探究

Exploring the Benefits of Teams in Multiagent Learning

David Radke, Kate Larson, Tim Brecht

TL;DR本文提出了一种基于组织心理学和早期人工智能团队工作的新型强化学习智能体多智能体团队模型，验证结果表明，尽管有不合作的动机，代理分成团队后仍然能发展出合作的政策，能在团队内更好地协调和学习相应角色，并比所有代理利益一致时获得更高的回报。

Abstract

For problems requiring cooperation, many multiagent systems implement solutions among either individual agents or across an entire population towards a common goal. Multiagent teams are primarily studied when in

multiagent systems reinforcement learning teams coordination incentives

发现论文，激发创造

多智能体团队学习的更深层理解

研究团队结构在群体学习中的影响，结果显示，某些团队结构帮助代理程序学习特定角色，从而获得更有利的全局结果；然而，大型团队创建的信用分配挑战降低了协调性，导致大型团队表现不如小型团队。

Jun, 2023

多智能体团队中可迁移合作行为的学习

提出使用共享的代理 - 实体图来建模多智能体相互作用，并利用基于图的强化学习训练代理实现协作行为，实现了对多种任务的有效解决，并展示了其泛化能力。

Jun, 2019

多智能体强化学习中的协作课程学习

在多智能体环境中，通过使用降低技能水平的协作队友为学习代理制定学习课程，能够同时实现任务完成与整体团队奖励最优。

Dec, 2023

多智能体学习中的合作回顾

多智能体学习是一门涉及博弈论、经济学、社会科学和进化生物学等众多学科交叉的主题。本文概述了多智能体学习的基本概念、问题设置和算法，包括增强学习、多智能体序列决策、多智能体合作的挑战，对最近进展进行了全面综述和相关度量评估，并讨论了该领域的开放性挑战，以期激发新的研究方向。

Dec, 2023

学习在团队规模间转移角色分配

我们提出了一个基于角色的多智能体强化学习框架，该框架使用角色分配网络将学习代理分配到团队中，以适应不同的团队大小，并通过 StarCraft II 模拟来展示该方法的有效性。

Apr, 2022

多智能体强化学习中协作新兴行为的衡量

本研究介绍了一种新方法，用于定量评估多智能体强化学习算法在连续空间任务中的协作能力，提供一个有用的训练信号来增强机器间和人机间的未来协作。

Jul, 2018

竞争中的协同涌现

通过引入具有连续模拟物理的具有挑战性的竞争性多智能体足球环境，我们研究了加强学习智能体中合作行为的出现。我们演示了分散、基于人口的联合训练能够导致代理行为的进步：从随机的行为到简单的球追逐，最终呈现出合作的迹象。我们进一步应用了一个由博弈论原理支持的评估方案，可以在没有预定义评估任务或人类基准的情况下评估代理的性能。

Feb, 2019

演化内在动机以促进利他行为

本篇论文研究多智体系统中的合作问题，发现可通过结合自然选择与 MARL 来实现无模型的协作特征学习，支持多层次选择的创新模块化架构结构为此提供了解决方案。

Nov, 2018

合作多智体强化学习中的教学学习

本文提出了一种新的算法，名为 Learning to Coordinate and Teach Reinforcement（LeCTR），通过在协作多智能体强化学习中使每个代理都学习何时提供何种建议，从而改善整个团队性能和学习效果。实证比较表明，我们的教学代理不仅学习速度更快，而且在现有方法失败的任务中也学会了协作。

May, 2018

通过多智能体联赛训练学习异质智能体协作

本研究提出了一种名为 Heterogeneous League Training (HLT) 的通用强化学习算法，用于解决异构多智能体问题，试验结果表明 HLT 可以提高异构团队在合作任务中的成功率，是解决策略版本迭代问题的有效途径，提供了评估异构团队中每个角色难度的实际方法。

Nov, 2022