BriefGPT.xyz
Ask
alpha
关键词
stochastic approximation algorithms
搜索结果 - 5
计算具有马尔可夫噪声的恒定步长随机逼近的偏差
研究马尔可夫噪声和常数步长的随机逼近算法,通过基于无穷小生成器比较的方法,研究算法的偏差以及时间平均偏差,证明其分别为 O (α) 和 αV + O (α^2),并且 Polyak-Ruppert 平均值收敛概率高于 θ* + αV。此外,
→
PDF
a month ago
TD 学习与线性函数逼近的简单有限时间分析
TD 学习在马尔可夫采样下,通过线性函数逼近存在有限时间收敛性的研究证明。通过新颖的两步论证方法,我们证明了在常数步长和标准选择下,TD 学习生成的迭代在期望上保持统一有界。这种方法大大简化了现有证明,并推测我们归纳证明技术将在更复杂的随机
→
PDF
4 months ago
随机嵌套复合双层优化,用于稳健的特征学习
该研究开发和分析了用于解决嵌套复合双层优化问题的随机逼近算法,并利用 Neumann 级数逼近来避免矩阵求逆,以实现对于存在偏差的随机梯度的稳定解决方案,研究成果具有在深度神经网络中应用鲁棒特征学习等方面的实际优势。
PDF
a year ago
状态依赖噪声的加速随机逼近
本文讨论了一类随机光滑凸优化问题,其噪声的方差与算法产生的近似解的次优性有关,提出了两个非欧几里德加速随机逼近算法,即随机加速梯度下降(SAGD)和随机梯度外推(SGE),并证明了在适当的条件下,这两个算法可以同时达到最优的迭代和样本复杂度
→
PDF
a year ago
二时间尺度强化学习的有限时间性能界和自适应学习率选择
本文研究两种时间尺度线性随机逼近算法,并使用一个基于奇异扰动理论的李雅普诺夫函数来得出有限时间性能界限,最终设计出一种自适应学习速率方案,以显著提高收敛速度和表现。
PDF
5 years ago
Prev
Next