深度学习作为最优控制问题：模型与数值方法

Apr, 2019

深度学习作为最优控制问题：模型与数值方法

Deep learning as optimal control problems: models and numerical methods

Martin Benning, Elena Celledoni, Matthias J. Ehrhardt, Brynjulf Owren, Carola-Bibiane Schönlieb

TL;DR本文探讨了深度学习神经网络作为最优控制问题的离散化，提出了一类算法来解决离散最优控制问题，并探讨了在时间离散化方面的延伸。

Abstract

We consider recent work of Haber and Ruthotto 2017 and Chang et al. 2018, where deep learning neural networks have been interpreted as discretisations of an →

deep learning neural networks optimal control problem discretisation time discretisation

发现论文，激发创造

深度学习的均值场最优控制公式

这篇文章介绍了将深度学习中的群体风险最小化问题作为均场最优控制问题进行数学公式化。通过引用均场 Pontryagin 的最大值原理，确立了种群和经验学习问题之间的一些定量关系，为探究最优控制和深度学习之间的算法和理论联系奠定了数学基础。

Jul, 2018

深度学习的最优控制方法及其在离散权重神经网络中的应用

本研究提出了一个基于离散时间最优控制问题的深度学习训练算法 (MSA)，通过约束权重在离散集合内来实现神经网络的训练，获得了具有竞争力表现的分类结果和非常稀疏的三值网络权重，这有助于在低内存设备上进行模型部署。

Mar, 2018

深度学习理论综述：最优控制与动态系统视角

本文基于动态系统和最优控制的视角，将现有的深度学习理论框架进行整合，并用随机动态的优化算法作为控制器，为超参数调整提供了一个基于原则的方法。

Aug, 2019

随机控制问题的深度学习逼近

通过蒙特卡洛采样的深度学习方法，将高维随机控制问题的时间依赖控制近似为前馈神经网络，用作控制问题的目标函数，经测试，该方法可以处理高维度问题并且具有令人满意的准确性。

Nov, 2016

深度神经网络的选择动态

本文介绍了一种基于偏微分方程框架的深度残差神经网络和相关学习问题的方法，并研究了前向问题的稳定性和最优性，同时探究了神经网络、PDE 理论、变分分析、优化控制和深度学习之间的算法和理论联系。

May, 2019

一个极小极大优化控制方法用于稳健神经 ODE

本文基于鲁棒控制的视角讨论神经 ODE 的对抗训练，引入了一种替代经验风险最小化的方法，通过可靠处理输入扰动来实现可靠结果。将深度神经网络解释为控制系统离散化，利用控制理论的强大工具来开发和理解机器学习。我们将带有扰动数据的对抗性训练描述为极小极大最优控制问题，并推导出 Pontryagin's Maximum Principle 形式的一阶最优性条件。我们提供了鲁棒训练的新解释，提出了一种替代加权技术，并在低维分类任务上进行了测试。

Oct, 2023

使用前向 - 后向 SDE 学习深度随机最优控制策略

本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究，旨在解决机器人和自主决策问题中的不确定性，并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中，我们研究了所提算法的性能和可扩展性，并讨论了未来的研究方向及其对机器人技术的影响。

Feb, 2019

深度神经网络、通用的普遍插值和可控制的 ODE

通过离散化有控制的常微分方程（也称为神经常微分方程）以及一些连接性，我们研究表达性质并展示了通用差错的普适插值性质（比通用逼近性质稍弱），并探究最少参数个数在保证表达能力的情况下的取值。

Aug, 2019

全耦合 FBSDE 驱动的随机最优控制问题的深度学习方法

通过深度学习方法，提出了一种解决高维随机最优控制问题的算法，将问题转化为随机 Stackelberg 差分博弈并应用交叉优化方法，成功解决了投资 - 消费问题的数值实例。

Apr, 2022

神经常微分方程作为非线性最优控制的反馈策略

本文提出了基于神经常微分方程（Neural ODEs）的神经控制策略，将控制策略优化问题转化为一个 Neural ODE 问题，有效地利用动态系统模型，展示了这种确定性神经控制策略在两个受控系统中的功效：控制的 Van der Pol 系统和一个生物反应器控制问题。该方法为非线性控制问题的无法处理的闭环解提供了一种实用的逼近方法。

Oct, 2022