BriefGPT.xyz
Ask
alpha
关键词
stochastic variance reduction methods
搜索结果 - 2
ICML
策略评估的随机方差缩减方法
本文提出了一种基于线性函数逼近的政策评估算法,将经验政策评估问题转化为一个凸凹优化鞍点问题,并通过一些批量梯度方法和随机方差约减方法解决问题,在实验中取得了良好的效果。
PDF
7 years ago
NIPS
鞍点问题的随机方差缩减方法
提出了一种新的随机优化算法,可以高效地解决凸 - 凹二次问题,并适用于更广泛类别的问题,该算法以局部更新的形式实现,可以使用非均匀采样来加速算法。
PDF
8 years ago
Prev
Next