Dec, 2023

随机逼近的收敛速度:有偏差噪声与无界方差,及其应用

TL;DR该研究论文主要讨论了随机逼近算法在嘈杂测量、凸凹优化、强化学习以及马尔可夫逼近方面的应用,并且扩展了该算法以包含具有非零条件均值和/或无界条件方差的错误,从而证明了算法在这些情况下的收敛性,并计算了“优化步长序列”以最大化估计的收敛速率。