本文回顾了关于数值方法在 Mean Field Games 及 Mean Field Control 类型问题中应用的各种方面,包括基于线性二次型、偏微分方程数值方案、Kolmogorov-Fokker-Planck 方程优化技巧、基于单调算子视角的方法以及依赖于机器学习工具的随机方法等。
Jun, 2021
该研究表明,均场博弈论(MFGs)是解释、增强和设计生成模型的数学框架,该文研究了 MFGs 与基于流和扩散的几种生成模型之间的关系,并探讨了 MFGs 的最优性条件及其算法应用。
Apr, 2023
針對具有局部耦合的均勻場博弈問題的數值逼近進行研究,提出了透過變分方法和近端類型方法的有效算法,並使用數值實驗評估了方法的性能。
Aug, 2016
利用基于 M3FG(major-minor MFGs)的学习算法,我们提出了一种新的离散时间版本的 M3FG,能够解决具有强影响力的主要玩家的问题,并在三个实例问题中验证了该理论结果的实际效果,从而为一类广泛可解的博弈问题建立了学习框架。
Dec, 2023
介绍了 J-M Lasry 和 P-L Lions 提出的描述随机微分博弈问题的极限行为的均场类型模型,作者在先前的作品中提出了这些模型的稳态和演化版本的近似方法,并在各种假设下证明了这些方法的收敛定理。
Jul, 2012
本文研究了离散时间有限 MFG 问题,通过使用熵正则化和 Boltzmann 策略使得固定点迭代收敛到近似固定点,同时提供了在高维场景下使用的近似 Nash 均衡算法以及结合虚拟博弈的深度强化学习方法。
Feb, 2021
本文提出了一种基于机器学习的灵活框架以数值解决潜在的平均场博弈和平均场控制问题,该框架避免使用空间离散化并利用拉格朗日和欧拉观点相结合的方法来近似解决高维问题。在标准工作站上近似解决了 100 维最优传输和人群运动问题,并在二维上进行了欧拉求解器的验证。这些结果为先前无法通过现有数值方法处理的 MFG 和 MFC 模型的应用开启了大门。
Dec, 2019
本文研究具有本地耦合的时变均值场博弈系统的数值逼近,使用基于变分方法的离散化方法,并应用 Chambolle 和 Pock 介绍的原始 - 对偶算法来解决其有限维变分问题,特别是使用适当的预处理迭代算法来改善解决线性系统的方法。
Feb, 2018
该论文综述如何运用强化学习和均值场博弈来解决无法通过传统方法计算的大规模人口问题,并针对静态、平稳和演变三个最常见的情境,提出一套基于最佳策略和策略评估的迭代方法以及没有模型计算的强化学习解决方案。
May, 2022
提出了两种基于神经网络参数的损失函数的数值方法,用于有限时间视野下的 McKean-Vlasov 动力学的最优控制,为确定如何近似于原始均场控制问题的解,引入了一种新的优化问题,并提供了误差率的严格说明。
Aug, 2019