BriefGPT.xyz
Ask
alpha
关键词
tail-averaging
搜索结果 - 2
基于线性函数逼近的时序差分学习的有限时间分析:尾平均和正则化
本研究研究了结合尾平均的时序差分(TD)学习算法的有限时间行为。研究发现,尾平均的 TD 在不需要信息的情况下,可以在期望和高概率下以最优的 $O (1/t)$ 速率收敛,我们提出和分析了一个增加了正则化的 TD 变量,结论表明正则化的 T
→
PDF
2 years ago
最小二乘回归的随机梯度下降并行化:小批量、平均和模型错误
该研究探讨了在随机梯度下降中广泛使用的平均方案的好处。特别是,通过对最小二乘回归的随机逼近问题进行非渐进超额风险分析,提供了这些方案的性能保证,并提出了高度可并行化的随机梯度下降方法。同时,该研究认为,为了保证最小极大风险,针对混浊噪声的步
→
PDF
8 years ago
Prev
Next