BriefGPT.xyz
Ask
alpha
关键词
stochastic coordinate descent
搜索结果 - 2
一种支配所有的方法:用于数据、参数和多种新方法的方差缩减
提出了一种通用的降方差的方法,适用于解决带有大量训练样例或大型模型维度或两者都有的正则化经验风险最小化问题。该方法可以减少已知的多种方法,同时提供了一种单一的定理,该定理可以证明在平滑和拟强凸性假设下的线性收敛性。此外,该方法还为随机梯度和
→
PDF
5 years ago
加速、并行和近端坐标下降
本篇论文提出了一种新的随机坐标下降方法,能够并行、加速和提高期望可分超逼近,此方法能够同时最小化依赖于少数坐标的多个凸函数的和,通过使用新的安全且大的步长,使得该方法不需要执行完整的矢量运算。
PDF
11 years ago
Prev
Next