May, 2024

计算具有马尔可夫噪声的恒定步长随机逼近的偏差

TL;DR研究马尔可夫噪声和常数步长的随机逼近算法,通过基于无穷小生成器比较的方法,研究算法的偏差以及时间平均偏差,证明其分别为 O (α) 和 αV + O (α^2),并且 Polyak-Ruppert 平均值收敛概率高于 θ* + αV。此外,结合 Richardson-Romberg 外推方法,构建一个具有 O (α^2) 偏差的迭代方案。