Nov, 2017

具有非光滑正则化的随机复合优化加速方法

TL;DR本文提出针对非光滑正则化惩罚的随机合成问题的最优化方法,在强凸组合问题中证明线性收敛,对于普通组合问题改进了现有的收敛速率,应用于强化学习中的投资组合管理和政策评估,结果验证了我们的理论分析。