BriefGPT.xyz
Ask
alpha
关键词
parallel
搜索结果 - 6
异构分布式学习中的小批量对比本地 SGD
本文研究异构分布共享的随机梯度下降优化问题,通过对比 Local SGD 和 Minibatch SGD,得到加速的 Minibatch SGD 是解决高异质性问题的最优方法,并提出了第一个比 Minibatch SGD 更好的 Local
→
PDF
4 years ago
演员 - 评论家集合学习中的奔跑学习
介绍了一种名为 Actor-Critic Ensemble(ACE)的方法,用于提高 Deep Deterministic Policy Gradient(DDPG)算法的性能,此方法在推理时使用批评家集合从多个并行运行的执行者建议中选择最
→
PDF
7 years ago
随机化的威力:大规模数据集上的分布式子模最大化
该论文提出了一个简单的分布式算法来解决在机器学习中的受限次模最大化问题,该算法可以并行运行并且提供可证明的常数近似保证,即使在单个机器上无法解决的问题也可以通过该算法高效地解决。
PDF
9 years ago
并行和分布式块坐标 Frank-Wolfe 算法
本文介绍并行和分布式 Frank-wolfe 算法,其中涉及异步计算和块可分约束,并给出了实验结果。
PDF
10 years ago
异步随机坐标下降:并行与收敛性质
本文提出一种异步并行随机近端坐标下降算法,用于最小化由光滑凸函数和可分离凸函数组成的复合目标函数,并给出在多核处理器上的实现结果。
PDF
10 years ago
加速、并行和近端坐标下降
本篇论文提出了一种新的随机坐标下降方法,能够并行、加速和提高期望可分超逼近,此方法能够同时最小化依赖于少数坐标的多个凸函数的和,通过使用新的安全且大的步长,使得该方法不需要执行完整的矢量运算。
PDF
11 years ago
Prev
Next