众多战略代理系统中的分散式学习

Mar, 2018

众多战略代理系统中的分散式学习

Decentralised Learning in Systems with Many, Many Strategic Agents

David Mguni, Joel Jennings, Enrique Munoz de Cote

TL;DR我们提出了一种计算多智能体系统中闭环最优策略的方法，并证明了在拥有无限个智能体的系统中成功收敛到最优行为，而且我们的方法具有完全分散的特性，能够在经济和控制理论中的实际应用中收敛到纳什均衡策略。

Abstract

Although multi-agent reinforcement learning can tackle systems of strategically interacting entities, it currently fails in scalability and lacks rigorous →

multi-agent reinforcement learning scalability convergence guarantees n-player stochastic games nash-equilibrium policies

发现论文，激发创造

基于策略梯度的可扩展集中化深度多智体强化学习

探索使用强化学习解决多智能体问题，将多智能体强化学习问题视为分布式优化问题处理，假设多智能体群体中每个智能体的策略在参数空间中相近且可以用单一策略代替，结果表明该算法在协作和竞争任务上比现有方法更加有效。

May, 2018

多智能体学习的稳定性：多人网络博弈中的收敛性

多智能体学习在网络游戏中表现出复杂的动态特性，通过研究 Q 学习的动态特性，确定了在任何网络游戏中收敛到唯一均衡的充分条件，并且在适当的网络条件下，可以实现任意数量智能体的稳定学习动态。

Jul, 2023

大规模人口系统和可扩展多智能体强化学习调查

这篇综述论文研究了在大规模群体系统中进行可控分析和多智能体强化学习的关键问题和挑战，介绍了现有的相关研究领域和方法，并讨论了未来的应用前景和方向。

Sep, 2022

合作多智体强化学习的共识学习

本研究提出了一种协作多智能体强化学习的共识学习方法，通过基于本地观察的共识学习，在分散式执行期间将推断出来的共识明确地作为智能体网络的输入，从而发展他们的合作精神，并在若干完全合作任务上获得了令人信服的结果。

Jun, 2022

自适应学习速率仍无法解决大规模多智能体学习中的混沌问题

在大规模拥挤博弈中，即使使用自适应学习率，也无法消除混沌行为，我们的实验表明系统参数的微小变化会导致各种不可预测的结果。

Jun, 2023

随机博弈中的独立学习

本综述介绍了一个新的独立学习动力学网络，其保证了在零和随机博弈中的收敛性，同时也回顾了其他算法，以期推动研究有关动态环境下博弈的独立和自然学习动力学。

Nov, 2021

去中心化强化学习：通过本地经济交易进行全局决策制定

该研究旨在建立一个框架，以引导一群简单、专业、自我利益代理人解决传统上作为整体单一代理人序列决策问题的难题，并通过设计一种学习环境机制，使每个代理人的最优解与 Nash 平衡策略一致，并为其推导出了一类分散式强化学习算法，同时展示了该社群内在结构对于更高效的迁移学习可能带来的潜在优势。

Jul, 2020

强化学习优化：从单智能体到协作智能体

该文章回顾了多智能体强化学习算法在大型控制系统和通信网络方面的最新进展，主要关注不同协调协议下的分散设置，并从分布式优化的视角突出了强化学习算法从单一智能体到多智能体系统的演变，强调多智能体强化学习与分布式优化、信号处理之间的合作，并总结了未来的发展方向与挑战。

Dec, 2019

完全去中心化的合作多智能体强化学习：调查

该论文系统地回顾了两种全面分散设置下的全面分散方法，即最大化所有代理的共享奖励和最大化所有代理的个人奖励之和，并讨论了未来研究方向。

Jan, 2024

关于多智能体非线性滤波和学习的动态

本篇论文研究了具有非线性滤波和学习动态的多智能体网络系统的行为，提出了多智能体网络系统中一个智能体的行为的一般表达式，并给出了实现协同学习行为的条件。同时，还介绍了该框架在分布式学习和联邦学习场景中的应用。

Sep, 2023