Nov, 2016

随机控制问题的深度学习逼近

TL;DR通过蒙特卡洛采样的深度学习方法,将高维随机控制问题的时间依赖控制近似为前馈神经网络,用作控制问题的目标函数,经测试,该方法可以处理高维度问题并且具有令人满意的准确性。