Jan, 2024

快速非线性两时间刻度随机逼近:达到 O (1/k) 有限样本复杂度

TL;DR提出了一种新的两时间尺度随机逼近方法,用于找到两个耦合非线性操作符的根,仅假定可以观察到这些操作符的噪声样本,并通过经典的 Ruppert-Polyak 平均技术动态估计操作符的样本,将所估计的平均步骤值用于两时间尺度随机逼近更新以找到所需的解,我们的主要理论结果是在强单调条件下,该方法生成的迭代序列的均方误差收敛到零的最优速率为 O (1/k),其中 k 是迭代次数,这一结果显著改进了现有的两时间尺度随机逼近结果,其已知的有限时间收敛速率为 O (1/k^(2/3))。