控制的均值场博弈及其在交易拥挤中的应用
本文回顾了关于数值方法在 Mean Field Games 及 Mean Field Control 类型问题中应用的各种方面,包括基于线性二次型、偏微分方程数值方案、Kolmogorov-Fokker-Planck 方程优化技巧、基于单调算子视角的方法以及依赖于机器学习工具的随机方法等。
Jun, 2021
本文研究了均场博弈中的模仿学习问题,引入了 Nash 模仿差作为新的解决方案,研究发现在仅收益需求受到人口分布影响时,该问题等价于单智能体模仿学习,并给出了适用于整体系统动力学的新的上界限定。
Jun, 2023
我们研究了一种价格形成模型,其中大量小型参与者可以存储和交易电力。我们的模型是一种受限均值场博弈(MFG),价格是供需平衡条件的 Lagrange 乘子。我们确定了唯一解的存在,并使用固定点论证明了价格是随时间变化的 Lipschitz 函数。然后,我们对线性二次模型进行研究,可以明确求解,并将我们的模型与现实数据进行了比较。
Jul, 2018
该论文综述如何运用强化学习和均值场博弈来解决无法通过传统方法计算的大规模人口问题,并针对静态、平稳和演变三个最常见的情境,提出一套基于最佳策略和策略评估的迭代方法以及没有模型计算的强化学习解决方案。
May, 2022
本文提出了一种基于机器学习的灵活框架以数值解决潜在的平均场博弈和平均场控制问题,该框架避免使用空间离散化并利用拉格朗日和欧拉观点相结合的方法来近似解决高维问题。在标准工作站上近似解决了 100 维最优传输和人群运动问题,并在二维上进行了欧拉求解器的验证。这些结果为先前无法通过现有数值方法处理的 MFG 和 MFC 模型的应用开启了大门。
Dec, 2019
本研究提出了一种强化学习算法,通过调整两个学习参数的比例,同一算法可以学习解决无限时间视角的均值场游戏与控制问题,并通过离散时间和空间中的智能体提供环境动作与状态分布来解决均值场问题。在连续时间和空间中展示渐进性均值场游戏与控制问题,并使用线性二次问题得到显式解作为算法结果的基准。
Jun, 2020
利用基于 M3FG(major-minor MFGs)的学习算法,我们提出了一种新的离散时间版本的 M3FG,能够解决具有强影响力的主要玩家的问题,并在三个实例问题中验证了该理论结果的实际效果,从而为一类广泛可解的博弈问题建立了学习框架。
Dec, 2023
本文介绍了一种结合了均场博弈和马尔科夫决策过程的模型,该模型能够解决大规模群体行为的表示和分布预测问题。通过深度逆强化学习,模型可以从真实数据中学习到均场博弈中的奖励函数和前向动态,以推断大型实际系统的均场博弈模型。首次将均场博弈模型应用到社交媒体人口研究领域。
Nov, 2017
本文介绍了一种具有等待成本的随机订单驱动市场模型,采用均场博弈理论,考虑不同交易者的订单簿和流动性供求对价格的影响,研究了机构投资者和高频交易者在市场上的的共存对市场效率等因素的影响。研究发现,虽然机构投资者单独存在时可能存在无效的流动性不平衡,但在与高频交易者共存时,此类宏观现象消失且高频交易者获得了更大的好处,留给机构投资者更高的交易成本。
May, 2013
利用机器学习中的泛化功能,我们研究如何学习政策,使典型代理能够针对任何人口分布表现最佳。我们提出了一种方法来学习这样的 Master 策略,并且证明了单个 Master 策略提供了纳什均衡。我们的方法基于三个方面:将当前人口分布添加为观察的一部分,使用神经网络逼近 Master 策略,使用强化学习和虚拟博弈进行训练。我们通过数值示例展示了所学习的 Master 策略的高效性以及其超越训练中使用的分布的推广能力。
Sep, 2021