Jan, 2024

任意循环数据抽样的随机优化

TL;DR使用定期化的最小化增量替代优化算法 (MISO),基于常规的重复采样方案,在非凸、可能非光滑的目标函数上,期望的最优性差随着数据点数量的增加以最佳速率 O(n^{-1/2}) 收敛。更进一步,暗示常数明确取决于“重复速度”,通过对预期访问给定数据点的时间进行平均(“目标时间”)或最大化(“击中时间”)测量。我们的研究理论上和实证上证明,通过选择最有效地覆盖数据集的采样算法,可以加速收敛速度。我们还讨论了该通用框架在分散优化和分布式非负矩阵分解方面的应用。