Aug, 2019

机器学习算法在数值均场控制和博弈中的收敛性分析:第 Ⅱ 部分 -- 有限时间域情形

TL;DR提出了两种基于神经网络参数的损失函数的数值方法,用于有限时间视野下的 McKean-Vlasov 动力学的最优控制,为确定如何近似于原始均场控制问题的解,引入了一种新的优化问题,并提供了误差率的严格说明。