BriefGPT.xyz
Ask
alpha
关键词
linear stochastic approximation algorithm
搜索结果 - 1
线性随机逼近和 TD 学习的有限时间误差界
考虑由 Markovian 噪声驱动的线性随机逼近算法的动态特性,通过考虑适当选择的 Lyapunov 函数的漂移,获得常数步长算法的有限时间误差的二次矩的有限时间界限。我们还对逼近误差 2 范数的平方的矩进行了全面的处理。
PDF
5 years ago
Prev
Next