随机控制问题的深度学习逼近
本研究提出了一个基于离散时间最优控制问题的深度学习训练算法 (MSA),通过约束权重在离散集合内来实现神经网络的训练,获得了具有竞争力表现的分类结果和非常稀疏的三值网络权重,这有助于在低内存设备上进行模型部署。
Mar, 2018
现有的最优控制方法在处理真实系统中常遇到的复杂性(包括维度、过程误差、模型偏差和数据异质性)时遇到困难。最优控制方法通常寻求简化模型以适应,但何时适用于近似的、简化的模型的最优解胜过适用于更准确的模型的近似解尚未得到充分回答。深度强化学习(DRL)中的算法和计算进展为我们解决这些问题提供了可能性。DRL 方法迄今主要应用于游戏或机器人机械学中,在确切已知规则下运行。我们在没有了解或企图推断进程模型的情况下,展示了使用深度神经网络进行 DRL 算法的能力,成功近似求解了一个非线性三变量渔业模型的解(“策略函数” 或控制规则)。我们发现强化学习代理通过简化问题来获得可解释的控制规则。我们展示了 DRL 所获得的策略在渔业管理中既更具利润性,也更具可持续性,胜过了任何固定死亡率政策 —— 渔业管理中的标准政策家族。
Aug, 2023
本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究,旨在解决机器人和自主决策问题中的不确定性,并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中,我们研究了所提算法的性能和可扩展性,并讨论了未来的研究方向及其对机器人技术的影响。
Feb, 2019
通过深度学习方法,提出了一种解决高维随机最优控制问题的算法,将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法,成功解决了投资 - 消费问题的数值实例。
Apr, 2022
该研究表明,对于具有强刚性系数的广泛控制随机微分方程,相关零和博弈的价值函数可以由深度人工神经网络来表示,该网络的复杂度在状态方程的维度和所需精度的倒数方面都呈多项式增长。
Mar, 2019
我们提出了一种基于有限维控制的方法来近似解决高维演化型偏微分方程的解算符。通过使用通用的降阶模型,例如深度神经网络,我们将模型参数的演化与相应函数空间中的轨迹连接起来。利用神经常微分方程的计算技术,我们学习参数空间上的控制,从而使受控轨迹与 PDE 的解非常接近。对于一类二阶非线性 PDE,我们验证了近似精确度。对几个高维 PDE,包括解决 Hamilton-Jacobi-Bellman 方程的真实应用,我们展示了所提方法的准确性和效率。
Jan, 2024
通过采用基于漂移放松的采样方法,本文研究了 Deep Galerkin 方法所面临的采样问题,通过验证 Sznajd 和 Hegselmann-Krause 模型中的意见动态变化的多场控制问题,得出的策略在手动优化控制函数上实现了显著成本降低,并在 Deep FBSDE 方法上改进了线性 - 二次调节器问题。
Jun, 2024