随机延迟微分博弈:金融建模与机器学习算法
提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡,该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题,并通过迭代解决。
Dec, 2019
本文提出了一种深度学习方法 —— 深度虚拟博弈,并应用于计算有限非零和随机微分博弈的纳什均衡,在每个阶段让各个博弈者优化自己的收益,用深度神经网络进行近似求解,基于虚拟博弈策略的深度学习算法具有可扩展性、并行性和模型无关性,并证明了在适当的假设下虚拟博弈收敛于开环纳什均衡。
Mar, 2019
研究了一种基于深度虚假博弈算法的高效工具,来寻找大型 N 玩家随机微分博弈的马尔可夫纳什平衡,并提出了一种新的游戏解耦方法,证明了算法的收敛性,并且在理论假设之外的情况下,提出了大人口游戏的数值结果。
Aug, 2020
通过蒙特卡洛采样的深度学习方法,将高维随机控制问题的时间依赖控制近似为前馈神经网络,用作控制问题的目标函数,经测试,该方法可以处理高维度问题并且具有令人满意的准确性。
Nov, 2016
本文介绍了一种用于具有延迟反馈环境中的控制问题的新的强化学习方法,该方法采用了随机规划而非以前使用的确定性规划方法,从而在策略优化问题中嵌入了风险偏好。我们展示了该方法能够恢复具有确定性转换的问题的最优策略,并将其与文献中的两种先前方法进行对比。我们将该方法应用于简单任务以了解其特点,然后比较了这些方法在控制多个 Atari 游戏方面的性能。
Feb, 2024
通过深度学习方法,提出了一种解决高维随机最优控制问题的算法,将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法,成功解决了投资 - 消费问题的数值实例。
Apr, 2022
通过前向 - 后向随机微分方程的纳什均衡特性和随机微分博弈的机器学习算法的最新进展,本文针对相对绩效准则下的最优投资提出了一种基于图上游戏的深度学习方法,并对两个不同的金融模型进行了数值实验,比较了几个不同的图上结构对结果的影响。
Feb, 2024
本文介绍了一种基于延迟微分方程(DDE)的连续时间神经网络方法,使用伴随灵敏度方法从数据中直接学习模型参数和延迟。该方法可以学习 DDE 参数,表现出良好的敏感性分析能力,并涉及到机器学习、动力系统学和神经网络等领域。
Apr, 2023
该研究表明,对于具有强刚性系数的广泛控制随机微分方程,相关零和博弈的价值函数可以由深度人工神经网络来表示,该网络的复杂度在状态方程的维度和所需精度的倒数方面都呈多项式增长。
Mar, 2019