- 一个在线代理能够高效学习均场博弈
使用在线样本,无需先验知识的状态 - 动作空间、奖励函数或转移动态,通过值函数 (Q) 更新策略,同时评估均场状态 (M),以有效逼近固定点迭代 (FPI) 的两种变种的新型在线单智能体无模型学习方案的功效通过数值实验得到确认。
- 基于深度强化学习的面向人口的在线镜像下降法求解均场博弈
我们提出了一种深度强化学习算法,通过设计额外的内循环重放缓冲区,代理可以有效地学习如何从任何分布实现纳什均衡,从而在大规模多智能体系统中实现依赖于人口的纳什均衡。数值实验结果表明,我们的算法具有比现有技术的算法更好的收敛性质,特别是对于依赖 - ICLR在稀疏图上学习均值场博弈:一种混合图 ex 方法
学习大规模代理人群的行为是许多研究领域的重要任务。尽管多智能体强化学习(MARL)领域在解决这些系统上取得了重要进展,但对于许多代理人,解决方案通常在计算上不可行且缺乏理论保证。平均场博弈(MFG)解决了这两个问题,并可扩展为包括代理人之间 - AAAI离散时间主次均值场博弈的学习
利用基于 M3FG(major-minor MFGs)的学习算法,我们提出了一种新的离散时间版本的 M3FG,能够解决具有强影响力的主要玩家的问题,并在三个实例问题中验证了该理论结果的实际效果,从而为一类广泛可解的博弈问题建立了学习框架。
- 从人口和环境观察中利用高斯过程解码平均场博弈
通过利用高斯过程 (Gaussian Process) 框架来解决均场博弈 (mean field games) 中的反问题,我们的方法是一种概率工具,通过部分和嘈杂的观测数据来推断均场博弈中代理的行为和环境的配置。
- 稳定均场博弈的策略更新规则正则化
本文介绍一种名为 MF-PPO 的算法,它采用邻域策略梯度更新来调整变差的均值场博弈策略,从而提高非合作多智能体强化学习系统的稳定性和效率。
- 学习平均场博弈:一项调查
该论文综述如何运用强化学习和均值场博弈来解决无法通过传统方法计算的大规模人口问题,并针对静态、平稳和演变三个最常见的情境,提出一套基于最佳策略和策略评估的迭代方法以及没有模型计算的强化学习解决方案。
- 超图平均场博弈
使用超图的概念和均值场博弈理论,提出了一种建模大规模多智能体动力系统的方法,可以跨超过两个 Agent 进行交互,该方法被扩展到多层设置中,并被用于社交舆论和传染病控制问题的实证研究。
- 基于均场博弈的可伸缩深度强化学习算法
本文提出了两种方法解决深度强化学习算法在非线性函数逼近下,无法很好地处理 mean field games 的情况。第一种方法是通过神经网络将历史数据蒸馏为混合策略,应用于 Fictitious Play 算法。第二种方法是一种基于正则化的 - 通过学习主策略进行均场博弈中的泛化
利用机器学习中的泛化功能,我们研究如何学习政策,使典型代理能够针对任何人口分布表现最佳。我们提出了一种方法来学习这样的 Master 策略,并且证明了单个 Master 策略提供了纳什均衡。我们的方法基于三个方面:将当前人口分布添加为观察的 - 均场博弈和均场类型控制的数值方法
本文回顾了关于数值方法在 Mean Field Games 及 Mean Field Control 类型问题中应用的各种方面,包括基于线性二次型、偏微分方程数值方案、Kolmogorov-Fokker-Planck 方程优化技巧、基于单调 - 使用在线镜像下降方法扩展均值场博弈
本研究使用在线镜像下降法(OMD)解决均值场游戏(MFG)中均衡计算的扩展性问题,在一系列合理的单调性假设下,证明连续时间 OMD 可收敛于纳什均衡,这一理论结果良好地扩展至多人口游戏和涉及共同噪声的设置。经过全面的实验研究,OMD 优于传 - 用机器学习框架解决高维场均值博弈和场均值控制问题
本文提出了一种基于机器学习的灵活框架以数值解决潜在的平均场博弈和平均场控制问题,该框架避免使用空间离散化并利用拉格朗日和欧拉观点相结合的方法来近似解决高维问题。在标准工作站上近似解决了 100 维最优传输和人群运动问题,并在二维上进行了欧拉 - 随机图参与博弈:静态案例
讨论静态有限玩家网络游戏及其连续模型图空游戏,提供存在性、唯一性和收敛性结果,说明图空游戏的均衡策略提供有限玩家游戏的近似纳什均衡,探讨了与均场游戏和中央计划者优化问题的联系并提供其纳什均衡和社会最优策略的明确计算。
- 离散均场博弈:平衡存在性和收敛性
本文考虑具有离散状态空间(称为离散平均场博弈)的平均场博弈,并在有限和无限时间范围内分析这些博弈的连续和离散时间。我们证明了在成本和驱动连续的假设下存在均场平衡。此外,我们还研究了在四个环境中 N 人博弈的均衡趋于均值场均衡的情况。
- 具有主、次参与者的有限状态均场博弈
本论文旨在发展有限状态的均值场博弈理论,通过引入有限玩家游戏,推导出当小玩家数量趋向无限时的均值场博弈公式,并证明了合理假设下纳什均衡存在的存在性和近似纳什均衡的构造,从而验证了我们对均值场博弈问题的观点。
- 带有局部耦合的定态均场博弈的近端方法
針對具有局部耦合的均勻場博弈問題的數值逼近進行研究,提出了透過變分方法和近端類型方法的有效算法,並使用數值實驗評估了方法的性能。
- 分离的均场博弈模型
本文介绍和分析了平均场博弈框架下描述两个人群相互作用的一些模型,探讨了静态和带噪声微分游戏的解的存在性,提出了数值方法和模拟,强调了人口之间种族隔离现象。
- 具有共同噪声的线性二次平均场类型控制和均场博弈,在可耗尽资源生产中的应用
本文研究了一般的线性二次平均场控制问题并将其与类似类型的平均场博弈相连接。在某些情况下,均值场类型控制的解也是一类均值场博弈的均衡策略。我们利用这个事实来研究可排出资源的生产经济模型。
- 具有共同噪声的平移不变均场博弈
本文介绍了一类特殊的均值场博弈,其中的系数满足卷积型结构条件。具有共同噪声的这种均值场博弈可以通过简单的转换与一定的无共同噪声的均值场博弈相关联,从而可以从问题无解的情况中得出其问题的可解构造。