深度多任务神经网络解决一些随机最优控制问题

Jan, 2024

深度多任务神经网络解决一些随机最优控制问题

Deep multitask neural networks for solving some stochastic optimal control problems

Christian Yeo

TL;DR本研究论文采用多任务神经网络的有效解法，通过数值实验，证明其在处理实际金融衍生品定价问题上优于现有方法。

Abstract

Most existing neural network-based approaches for solving stochastic optimal control problems using the associated backward dynamic programming principle rely on the ability to simulate the underlying state variables. However, in some problems, this simulation is infeasible, leading to

neural network-based approaches stochastic optimal control problems backwards dynamic programming multitask neural networks derivatives pricing problems

发现论文，激发创造

随机控制问题的深度学习逼近

通过蒙特卡洛采样的深度学习方法，将高维随机控制问题的时间依赖控制近似为前馈神经网络，用作控制问题的目标函数，经测试，该方法可以处理高维度问题并且具有令人满意的准确性。

Nov, 2016

探索深度和循环结构用于最优控制

本文研究了多层神经网络在控制方面的应用，特别是在连续高维动作任务中，通过强化学习训练后实现了控制策略，结果表明可以成功训练具有成千上万个参数的神经网络控制器，并比较了各种不同结构。文章讨论了这一问题与以往有监督知觉任务的区别，呈现了实验结果，并讨论了将深度学习技术应用于控制问题优化的未来方向。

Nov, 2013

深度学习的最优控制方法及其在离散权重神经网络中的应用

本研究提出了一个基于离散时间最优控制问题的深度学习训练算法 (MSA)，通过约束权重在离散集合内来实现神经网络的训练，获得了具有竞争力表现的分类结果和非常稀疏的三值网络权重，这有助于在低内存设备上进行模型部署。

Mar, 2018

使用前向 - 后向 SDE 学习深度随机最优控制策略

本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究，旨在解决机器人和自主决策问题中的不确定性，并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中，我们研究了所提算法的性能和可扩展性，并讨论了未来的研究方向及其对机器人技术的影响。

Feb, 2019

全耦合 FBSDE 驱动的随机最优控制问题的深度学习方法

通过深度学习方法，提出了一种解决高维随机最优控制问题的算法，将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法，成功解决了投资 - 消费问题的数值实例。

Apr, 2022

深度学习作为最优控制问题：模型与数值方法

本文探讨了深度学习神经网络作为最优控制问题的离散化，提出了一类算法来解决离散最优控制问题，并探讨了在时间离散化方面的延伸。

Apr, 2019

基于神经网络的混合系统辨识方法

我们考虑从有限数量的（状态 - 输入）- 后继状态数据点中设计一种基于机器学习的未知动态系统模型的问题，以便获得的模型也适用于最优控制设计。我们提出了一种特定的神经网络（NN）结构，其产生具有分段仿射动力学的混合系统，对网络参数具有可微性，从而使得能够使用基于导数的训练过程。我们展示了对 NN 权重的精心选择产生具有结构特性的混合系统模型，在有限视野最优控制问题（OCP）的计算方面具有非常有利条件。具体而言，我们表明可以通过非线性规划计算具有强大局部最优性保证的最优解，与通常需要混合整数优化的一般混合系统的经典 OCP 相比。除了非常适用于最优控制设计外，数值模拟还说明我们基于 NN 的技术在混合系统的系统识别方法方面具有非常类似的性能，并且在非线性基准测试中具有竞争力。

Apr, 2024

通过随机神经网络实现最优停止策略

该研究提出了使用机器学习方法来近似解决最优停止问题的新方法，其中我们使用神经网络来逼近继续价值。这些方法适用于高维问题，可以使用简单的线性回归来优化，已获得理论保证。其中，我们的随机强化学习方法和随机循环神经网络方法在 Markovian 和非 Markovian 示例中都优于现有最先进的机器学习方法，并且这些方法还可以用于有效计算美式期权的希腊字母。

Apr, 2021

主动学习强化学习：一种随机最优控制方法

本文提供了一个应对强化学习的框架，解决了建模不确定性和计算成本高的问题，通过使用强化学习来解决随机动态规划方程，所得的强化学习控制器对多种类型的约束条件是安全的，并且可以主动学习建模不确定性，实现实时学习。通过模拟实例证明了提出方法的有效性。

Sep, 2023

高维 RBM 的漂移控制：基于神经网络的计算方法

通过深度神经网络技术开发和展示了一种基于模拟的计算方法来解决随机控制问题，将其准确性扩展到 $d=30$ 的维度。

Sep, 2023