通过蒙特卡洛采样的深度学习方法,将高维随机控制问题的时间依赖控制近似为前馈神经网络,用作控制问题的目标函数,经测试,该方法可以处理高维度问题并且具有令人满意的准确性。
Nov, 2016
本研究论文采用多任务神经网络的有效解法,通过数值实验,证明其在处理实际金融衍生品定价问题上优于现有方法。
Jan, 2024
通过采用基于漂移放松的采样方法,本文研究了 Deep Galerkin 方法所面临的采样问题,通过验证 Sznajd 和 Hegselmann-Krause 模型中的意见动态变化的多场控制问题,得出的策略在手动优化控制函数上实现了显著成本降低,并在 Deep FBSDE 方法上改进了线性 - 二次调节器问题。
Jun, 2024
本研究采用最新的深度强化学习算法(软演员 - 评论家),提出了一种不需要明确运动方程的强健漂移控制器,通过对不同难度的赛道进行训练,使车辆能够快速、稳定地漂移通过各种锐利的拐角,控制器被证明具有良好的泛化能力,可以直接处理具有不同物理特性的不同类型的车辆。
Jan, 2020
利用深度强化学习方法,成功控制了具有 200 个节点的转移间隔概率较高的有转移蜕变的黑色素瘤蛋白联锁网络
Oct, 2022
本文展示了可以将时间有序的量子演化视作层次有序的神经网络,并将鲁棒控制看作是训练高度泛化的神经网络,利用批处理优化技巧使优化的结果能够显着提高控制的鲁棒性和保持高保真度。
Nov, 2018
基于物理知识学习和动态规划,该研究旨在开发基于深度学习的算法来解决高维随机控制问题;通过引入与 Hamilton-Jacobi-Bellman 方程相关的路径操作,定义了一个物理知识学习问题,并提出了两种数值方法来求解该问题。研究对截断误差,逼近误差和优化误差对这些方法的准确性的影响进行了错误分析,并提供了各种应用的数值结果来说明所提算法的性能。
Feb, 2024
本文探讨了深度学习神经网络作为最优控制问题的离散化,提出了一类算法来解决离散最优控制问题,并探讨了在时间离散化方面的延伸。
Apr, 2019
考虑通过有限的干预来控制动态过程。我们将这个问题表述为关于时间图过程的顺序决策问题,并设计了一个新颖的可行方案来控制时间图上的动态过程。我们成功地将方法应用于两个流行问题:优先考虑哪些节点进行检测以限制疫情传播,以及影响最大化问题。
Oct, 2020
本文研究了多层神经网络在控制方面的应用,特别是在连续高维动作任务中,通过强化学习训练后实现了控制策略,结果表明可以成功训练具有成千上万个参数的神经网络控制器,并比较了各种不同结构。文章讨论了这一问题与以往有监督知觉任务的区别,呈现了实验结果,并讨论了将深度学习技术应用于控制问题优化的未来方向。
Nov, 2013