Nov, 2014

随机组合梯度下降:最小化期望值函数组合的算法

TL;DR通过提出一种随机复合梯度下降 (SCGD) 算法来解决最小化一个包含期望值或两个期望值函数组合的非线性函数的问题;该算法可以令 SCGD 收敛于凸优化问题的最优解,并且可以加速收敛于平稳点来解决非凸问题,进而解决学习、估计、动态规划等实践中常见的关于期望值函数组合的随机优化问题。