随机延迟微分博弈：金融建模与机器学习算法

Jul, 2023

随机延迟微分博弈：金融建模与机器学习算法

Stochastic Delay Differential Games: Financial Modeling and Machine Learning Algorithms

Robert Balkin, Hector D. Ceniceros, Ruimeng Hu

TL;DR本论文利用深度学习和循环神经网络的参数化控件，提出了一种找到随机延迟微分博弈的闭环纳什均衡的数值方法，并在金融相关问题上进行了测试。

Abstract

In this paper, we propose a numerical methodology for finding the closed-loop Nash equilibrium of stochastic delay differential games through deep learning. These games are prevalent in →

stochastic delay differential games closed-loop nash equilibrium deep learning recurrent neural networks finance

发现论文，激发创造

深度虚拟博弈对多智能体游戏中马尔科夫纳什均衡的寻找

提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡，该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题，并通过迭代解决。

Dec, 2019

随机微分博弈的深度虚构博弈

本文提出了一种深度学习方法 —— 深度虚拟博弈，并应用于计算有限非零和随机微分博弈的纳什均衡，在每个阶段让各个博弈者优化自己的收益，用深度神经网络进行近似求解，基于虚拟博弈策略的深度学习算法具有可扩展性、并行性和模型无关性，并证明了在适当的假设下虚拟博弈收敛于开环纳什均衡。

Mar, 2019

随机微分博弈的深度虚设策略收敛

研究了一种基于深度虚假博弈算法的高效工具，来寻找大型 N 玩家随机微分博弈的马尔可夫纳什平衡，并提出了一种新的游戏解耦方法，证明了算法的收敛性，并且在理论假设之外的情况下，提出了大人口游戏的数值结果。

Aug, 2020

随机控制问题的深度学习逼近

通过蒙特卡洛采样的深度学习方法，将高维随机控制问题的时间依赖控制近似为前馈神经网络，用作控制问题的目标函数，经测试，该方法可以处理高维度问题并且具有令人满意的准确性。

Nov, 2016

延迟随机环境中的控制：基于模型的强化学习方法

本文介绍了一种用于具有延迟反馈环境中的控制问题的新的强化学习方法，该方法采用了随机规划而非以前使用的确定性规划方法，从而在策略优化问题中嵌入了风险偏好。我们展示了该方法能够恢复具有确定性转换的问题的最优策略，并将其与文献中的两种先前方法进行对比。我们将该方法应用于简单任务以了解其特点，然后比较了这些方法在控制多个 Atari 游戏方面的性能。

Feb, 2024

全耦合 FBSDE 驱动的随机最优控制问题的深度学习方法

通过深度学习方法，提出了一种解决高维随机最优控制问题的算法，将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法，成功解决了投资 - 消费问题的数值实例。

Apr, 2022

基于深度学习方法的异质代理人相对绩效优化投资

通过前向 - 后向随机微分方程的纳什均衡特性和随机微分博弈的机器学习算法的最新进展，本文针对相对绩效准则下的最优投资提出了一种基于图上游戏的深度学习方法，并对两个不同的金融模型进行了数值实验，比较了几个不同的图上结构对结果的影响。

Feb, 2024

深度学习解决和估计动态宏观金融模型

本文介绍利用深度学习解决和估计金融经济学中的经典连续时间一般均衡模型的方法，并以两个实例说明其优点。

May, 2023

利用神经时滞微分方程进行时滞学习

本文介绍了一种基于延迟微分方程（DDE）的连续时间神经网络方法，使用伴随灵敏度方法从数据中直接学习模型参数和延迟。该方法可以学习 DDE 参数，表现出良好的敏感性分析能力，并涉及到机器学习、动力系统学和神经网络等领域。

Apr, 2023

修正的深度神经网络克服非线性僵硬系统的零和博弈中非平滑价值函数的维度诅咒

该研究表明，对于具有强刚性系数的广泛控制随机微分方程，相关零和博弈的价值函数可以由深度人工神经网络来表示，该网络的复杂度在状态方程的维度和所需精度的倒数方面都呈多项式增长。

Mar, 2019