May, 2019

随机方差减小策略梯度的收敛性改进分析

TL;DR研究改进了SVRPG方法的收敛性和采样复杂度问题,并通过理论分析和实验验证了重要性采样权重和批量大小参数的影响