高维 RBM 的漂移控制：基于神经网络的计算方法

Sep, 2023

高维 RBM 的漂移控制：基于神经网络的计算方法

Drift Control of High-Dimensional RBM: A Computational Method Based on Neural Networks

Baris Ata, J. Michael Harrison, Nian Si

TL;DR通过深度神经网络技术开发和展示了一种基于模拟的计算方法来解决随机控制问题，将其准确性扩展到 $d=30$ 的维度。

Abstract

Motivated by applications in queueing theory, we consider a stochastic control problem whose state space is the $d$-dimensional positive orthant. The controlled process $Z$ evolves as a reflected brownian motion

stochastic control problem reflected brownian motion orthant drift vector ergodic control problem

发现论文，激发创造

随机控制问题的深度学习逼近

通过蒙特卡洛采样的深度学习方法，将高维随机控制问题的时间依赖控制近似为前馈神经网络，用作控制问题的目标函数，经测试，该方法可以处理高维度问题并且具有令人满意的准确性。

Nov, 2016

深度多任务神经网络解决一些随机最优控制问题

本研究论文采用多任务神经网络的有效解法，通过数值实验，证明其在处理实际金融衍生品定价问题上优于现有方法。

Jan, 2024

基于深度 Galerkin 反馈法的智能体动力学最优控制

通过采用基于漂移放松的采样方法，本文研究了 Deep Galerkin 方法所面临的采样问题，通过验证 Sznajd 和 Hegselmann-Krause 模型中的意见动态变化的多场控制问题，得出的策略在手动优化控制函数上实现了显著成本降低，并在 Deep FBSDE 方法上改进了线性 - 二次调节器问题。

Jun, 2024

深度强化学习实现高速自主漂移

本研究采用最新的深度强化学习算法（软演员 - 评论家），提出了一种不需要明确运动方程的强健漂移控制器，通过对不同难度的赛道进行训练，使车辆能够快速、稳定地漂移通过各种锐利的拐角，控制器被证明具有良好的泛化能力，可以直接处理具有不同物理特性的不同类型的车辆。

Jan, 2020

深度加强学习用于大规模概率布尔网络稳定性控制

利用深度强化学习方法，成功控制了具有 200 个节点的转移间隔概率较高的有转移蜕变的黑色素瘤蛋白联锁网络

Oct, 2022

学习鲁棒和高精度的量子控制

本文展示了可以将时间有序的量子演化视作层次有序的神经网络，并将鲁棒控制看作是训练高度泛化的神经网络，利用批处理优化技巧使优化的结果能够显着提高控制的鲁棒性和保持高保真度。

Nov, 2018

基于路径 HJB 操作符的随机系统的神经最优控制器

基于物理知识学习和动态规划，该研究旨在开发基于深度学习的算法来解决高维随机控制问题；通过引入与 Hamilton-Jacobi-Bellman 方程相关的路径操作，定义了一个物理知识学习问题，并提出了两种数值方法来求解该问题。研究对截断误差，逼近误差和优化误差对这些方法的准确性的影响进行了错误分析，并提供了各种应用的数值结果来说明所提算法的性能。

Feb, 2024

深度学习作为最优控制问题：模型与数值方法

本文探讨了深度学习神经网络作为最优控制问题的离散化，提出了一类算法来解决离散最优控制问题，并探讨了在时间离散化方面的延伸。

Apr, 2019

利用强化学习和图神经网络控制图动态

考虑通过有限的干预来控制动态过程。我们将这个问题表述为关于时间图过程的顺序决策问题，并设计了一个新颖的可行方案来控制时间图上的动态过程。我们成功地将方法应用于两个流行问题：优先考虑哪些节点进行检测以限制疫情传播，以及影响最大化问题。

Oct, 2020

探索深度和循环结构用于最优控制

本文研究了多层神经网络在控制方面的应用，特别是在连续高维动作任务中，通过强化学习训练后实现了控制策略，结果表明可以成功训练具有成千上万个参数的神经网络控制器，并比较了各种不同结构。文章讨论了这一问题与以往有监督知觉任务的区别，呈现了实验结果，并讨论了将深度学习技术应用于控制问题优化的未来方向。

Nov, 2013