BriefGPT.xyz
Ask
alpha
关键词
constant stepsize
搜索结果 - 2
常步尺度 Q - 学习:分布收敛、偏差和推广
通过将常步长 Q 学习与时间齐次马尔可夫链连接,在 Wasserstein 距离中展示了迭代的分布收敛性,建立了其指数收敛速度;我们还为 Q 学习迭代建立了中心极限定理,证明了平均迭代的渐近正态性;此外,我们提供了对步长渐近偏差的显式扩展,
→
PDF
6 months ago
ADAM 算法固定步长的发散:一个(非常)简单的例子
在没有梯度噪声的情况下,构建了一个具有 Lipschitz 连续梯度的非常简单的一维函数,当应用 ADAM 算法以最小化该函数时,始于原点时会发散,无论选择的方法参数如何。
PDF
a year ago
Prev
Next