随机控制问题的深度学习逼近

Nov, 2016

Deep Learning Approximation for Stochastic Control Problems

Jiequn Han, Weinan E

TL;DR通过蒙特卡洛采样的深度学习方法，将高维随机控制问题的时间依赖控制近似为前馈神经网络，用作控制问题的目标函数，经测试，该方法可以处理高维度问题并且具有令人满意的准确性。

Abstract

Many real world stochastic control problems suffer from the "curse of dimensionality". To overcome this difficulty, we develop a deep learning approach that directly solves high-dimensional →

stochastic control deep learning monte-carlo sampling feedforward neural networks high-dimensional problems

发现论文，激发创造

深度多任务神经网络解决一些随机最优控制问题

本研究论文采用多任务神经网络的有效解法，通过数值实验，证明其在处理实际金融衍生品定价问题上优于现有方法。

Jan, 2024

深度学习作为最优控制问题：模型与数值方法

本文探讨了深度学习神经网络作为最优控制问题的离散化，提出了一类算法来解决离散最优控制问题，并探讨了在时间离散化方面的延伸。

Apr, 2019

深度学习的最优控制方法及其在离散权重神经网络中的应用

本研究提出了一个基于离散时间最优控制问题的深度学习训练算法 (MSA)，通过约束权重在离散集合内来实现神经网络的训练，获得了具有竞争力表现的分类结果和非常稀疏的三值网络权重，这有助于在低内存设备上进行模型部署。

Mar, 2018

相当好的控制：何时近似解法比近似模型更好

现有的最优控制方法在处理真实系统中常遇到的复杂性（包括维度、过程误差、模型偏差和数据异质性）时遇到困难。最优控制方法通常寻求简化模型以适应，但何时适用于近似的、简化的模型的最优解胜过适用于更准确的模型的近似解尚未得到充分回答。深度强化学习（DRL）中的算法和计算进展为我们解决这些问题提供了可能性。DRL 方法迄今主要应用于游戏或机器人机械学中，在确切已知规则下运行。我们在没有了解或企图推断进程模型的情况下，展示了使用深度神经网络进行 DRL 算法的能力，成功近似求解了一个非线性三变量渔业模型的解（“策略函数” 或控制规则）。我们发现强化学习代理通过简化问题来获得可解释的控制规则。我们展示了 DRL 所获得的策略在渔业管理中既更具利润性，也更具可持续性，胜过了任何固定死亡率政策 —— 渔业管理中的标准政策家族。

Aug, 2023

使用前向 - 后向 SDE 学习深度随机最优控制策略

本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究，旨在解决机器人和自主决策问题中的不确定性，并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中，我们研究了所提算法的性能和可扩展性，并讨论了未来的研究方向及其对机器人技术的影响。

Feb, 2019

全耦合 FBSDE 驱动的随机最优控制问题的深度学习方法

通过深度学习方法，提出了一种解决高维随机最优控制问题的算法，将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法，成功解决了投资 - 消费问题的数值实例。

Apr, 2022

修正的深度神经网络克服非线性僵硬系统的零和博弈中非平滑价值函数的维度诅咒

该研究表明，对于具有强刚性系数的广泛控制随机微分方程，相关零和博弈的价值函数可以由深度人工神经网络来表示，该网络的复杂度在状态方程的维度和所需精度的倒数方面都呈多项式增长。

Mar, 2019

高维偏微分方程的解算子的近似

我们提出了一种基于有限维控制的方法来近似解决高维演化型偏微分方程的解算符。通过使用通用的降阶模型，例如深度神经网络，我们将模型参数的演化与相应函数空间中的轨迹连接起来。利用神经常微分方程的计算技术，我们学习参数空间上的控制，从而使受控轨迹与 PDE 的解非常接近。对于一类二阶非线性 PDE，我们验证了近似精确度。对几个高维 PDE，包括解决 Hamilton-Jacobi-Bellman 方程的真实应用，我们展示了所提方法的准确性和效率。

Jan, 2024

高维 RBM 的漂移控制：基于神经网络的计算方法

通过深度神经网络技术开发和展示了一种基于模拟的计算方法来解决随机控制问题，将其准确性扩展到 $d=30$ 的维度。

Sep, 2023

基于深度 Galerkin 反馈法的智能体动力学最优控制

通过采用基于漂移放松的采样方法，本文研究了 Deep Galerkin 方法所面临的采样问题，通过验证 Sznajd 和 Hegselmann-Krause 模型中的意见动态变化的多场控制问题，得出的策略在手动优化控制函数上实现了显著成本降低，并在 Deep FBSDE 方法上改进了线性 - 二次调节器问题。

Jun, 2024