Jul, 2023

蒙特卡洛模拟和最大最优传输中的政策梯度最优相关搜索用于方差缩减

TL;DR提出了一种新的算法用于估计方差的减小,其中X是某个随机微分方程的解,f是测试函数。新的估计器是(f(X^1_T)+f(X^2_T))/2,其中X^1和X^2的边际法与X相同,但路径上具有相关性以减小方差。最优关联函数ρ由深度神经网络近似,并通过策略梯度和强化学习技术沿着(X^1, X^2)的轨迹进行校准。寻找给定边际法的最优耦合与最大最优输运有联系。