Apr, 2023

超参数化情况下随机重排的快速收敛及 Polyak-Łojasiewicz 条件

TL;DR研究了过度参数化的机器学习模型,提出了抽样无替换的 SGD 变体 - random reshuffling-,并证明了在一些假设条件下,它可以比 SGD 更快地收敛。此外,对于 Polyak-L ojasiewicz (PL) 函数类问题,当样本数小于条件数与参数之积或小于参数的强增长条件时,证明了 random reshuffling 优于 SGD。