前向 - 后向随机微分方程和可控的麦克汉 - 弗拉索夫动力学
本文讨论并比较了两种研究方法,以处理随机微分博弈的渐近区域,这种博 弈有有限个玩家,但玩家数量趋近于无穷。这两种方法在优化和极限通道的顺序上有所不同,一种是指平均场博弈,另一种是控制 McKean-Vlasov 类型的优化问题。这两个问题都涉及到前向后向随机微分方程的分析,其系数取决于解的边缘分布,我们通过研究相应的前向后向系统来说明两种方法的性质和解决方案的差异。文章还阐述了一般性的结果和特定的例子,特别是当代价函数是线性二次型时。
Oct, 2012
本文探讨了 McKean-Vlasov 随机微分方程的随机最优控制问题,通过使用反馈控制,将问题重构为只有过程的边际分布的确定性控制问题,并证明了动态规划原则在其一般形式下成立。然后,我们利用随机微分方程解的可导性概念,推导出平均场随机控制问题的 Bellman 方程,并在 McKean-Vlasov 框架下证明了验证定理。针对线性二次平均场控制问题,给出了 Bellman 方程的显式解,包括在平均方差组合选择和系统性风险模型等方面的应用。最后,我们考虑具有开环控制的 McKean-Vlasov 控制问题,并讨论相应的动态规划方程与闭环控制情况的比较。
Dec, 2015
提出了两种基于神经网络参数的损失函数的数值方法,用于有限时间视野下的 McKean-Vlasov 动力学的最优控制,为确定如何近似于原始均场控制问题的解,引入了一种新的优化问题,并提供了误差率的严格说明。
Aug, 2019
研究一种纯随机方法中的平均场反向随机微分方程的特殊平均场问题的近似解,证明其收敛速度为 1 /sqrt {N},并证明其三元组以一定意义收敛于一种前向 - 反向随机微分方程解,该解不仅受到布朗运动的控制,而且还受独立高斯场的控制。
Nov, 2007
研究平均场随机控制问题的 Pontryagin 最大原理,推荐一种新的变分方法来解决这些控制问题,并展示了弱形式与路径空间上的最优传输之间的自然联系,启发了一种新的离散化方案。
Feb, 2018
本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究,旨在解决机器人和自主决策问题中的不确定性,并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中,我们研究了所提算法的性能和可扩展性,并讨论了未来的研究方向及其对机器人技术的影响。
Feb, 2019
基于 McKean-Vlasov 类型的无限维非线性随机微分方程,我们提出了一个扩散过程粒子系统,通过链式网络结构耦合。它具有 (i) 局部链交互和 (ii) 平均场交互。由于局部链交互,混沌的传播不一定成立。此外,我们展示了平均场作用的存在或不存在的二分法,并讨论了从单个组分过程的观察中检测其存在的问题。
May, 2018
本文提出使用调整的 Euler-Maruyama 方案来处理 McKean-Vlasov 随机微分方程,该方案仅假设漂移和扩散系数具有标准单调性条件但状态变量没有全局 Lipschitz 连续性,措施项组件仅需要全局 Lipschitz 连续性,针对 FitzHugh-Nagumo 神经元的平均场模型,数值结果表明该调整方案在大多数情况下优于经过调整的逼近方案,同时还介绍并分析了一个针对具有线性措施依赖性漂移的某些子类 McKean-Vlasov SDE 的自适应 Milstein 方案。
May, 2020
本文介绍了一种基于控制论、深度学习和统计抽样理论的框架,来研究深度神经网络和神经 ODE 模型,包括 Mean-Field Langevin 动力学的梯度流、时间一致传播的混沌性等问题,并提供了与学习速率、粒子数 / 模型参数和梯度算法迭代次数相关的显式收敛速率和量化一般化误差界限。
Dec, 2019
本研究引入了平均场最优控制的概念,该概念是将建模多代理交互的 ODE 约束下的有限维最优控制问题与约束为 Vlasov 类型的 PDE 的无限维最优控制问题的严格极限过程。通过考虑损失函数中 $L^1$ -norm 项,惩罚广泛的控制组,同时促进其稀疏性,我们考虑关注政策制定者受到最佳策略的制约,以实现其与个体群体之间最简洁的相互作用。
Jun, 2013