Oct, 2024

MindFlayer:异构和随机工作计算时间下高效的异步并行随机梯度下降

TL;DR本研究解决了在异构和随机计算时间条件下,最小化平滑非凸函数的期望问题。我们提出了一种新的异步随机梯度下降方法MindFlayer SGD,能有效应对随机计算时间的挑战,其理论与实证结果表明MindFlayer SGD在处理重尾噪声时优于现有方法,包括Rennala SGD。