深度学习理论综述:最优控制与动态系统视角
这篇文章介绍了将深度学习中的群体风险最小化问题作为均场最优控制问题进行数学公式化。通过引用均场 Pontryagin 的最大值原理,确立了种群和经验学习问题之间的一些定量关系,为探究最优控制和深度学习之间的算法和理论联系奠定了数学基础。
Jul, 2018
利用控制论技术,通过在线适应法更新深度神经网络参数,控制域偏移以及解决稳定性和迁移学习问题,提高深度神经网络基于学习的系统的性能和保证。
Feb, 2024
不需了解动力学的情况下控制动态系统是一项重要且具有挑战性的任务。我们提出了一种控制理论方法,通过加入可控性约束来增强数据估计的模型,从而实现从数据中提取更有效的控制器。该方法展示了基于深度神经网络的模型估计与解决方案性质的控制理论保证之间的联系,并在两个标准经典控制系统中证明了其优势。
Nov, 2023
本研究提出了一个基于离散时间最优控制问题的深度学习训练算法 (MSA),通过约束权重在离散集合内来实现神经网络的训练,获得了具有竞争力表现的分类结果和非常稀疏的三值网络权重,这有助于在低内存设备上进行模型部署。
Mar, 2018
提出了一种通过将每个神经网络中的每个层视为动态博弈中的玩家来进行训练的优化器 Dynamic Game Theoretic Neural Optimizer (DGNOpt),该优化器不仅将 OCT-inspired 优化器推广到更丰富的网络类,还通过求解多人合作游戏来提出了一种新的训练原则,并在残差网络和 Inception 网络的图像分类数据集上表现出更好的收敛效果,结合了 OCT 和博弈论的优点,为稳健的最优控制和基于赌博机的优化提供了新的算法机会。
May, 2021
深度学习中优化的关键问题是通过学习优化器来加速优化过程,但其稳定性、泛化性仍存在问题。本研究通过分析网络架构对优化轨迹和参数更新分布的影响,研究并对比手动设计和学习优化器的优缺点,提出了关键见解。
Dec, 2023
本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究,旨在解决机器人和自主决策问题中的不确定性,并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中,我们研究了所提算法的性能和可扩展性,并讨论了未来的研究方向及其对机器人技术的影响。
Feb, 2019
研究了深度学习算法中存在的对抗性攻击问题,提供了一种新的对抗性训练算法,通过将最小 - 最大问题解释为最优控制问题进行优化,从而大幅度提高训练时间,并通过实验证明了该算法的稳定性和收敛性。
May, 2020
该研究利用连续时间动力系统的方法,将深度残差网络理想化为动力系统,从逼近的角度研究其通用逼近性,并建立了新的近似理论,揭示了流映射逼近组合函数的新范例,促进了深度学习中有用的数学框架的建立。
Dec, 2019