BriefGPT.xyz
Ask
alpha
关键词
stochastic gradient estimates
搜索结果 - 4
分布式随机凸优化的极小 - 极大复杂度及间歇通信
研究分布式随机凸优化的最小最大复杂度,在间歇通信设置下提出了一种新的下限和上限算法,以确定最佳算法。
PDF
3 years ago
k-tied 正态分布:贝叶斯神经网络中高斯均值场后验的紧凑参数化
通过对高斯均值场变分推理方法训练的深层贝叶斯神经网络的后验标准差进行矩阵低秩分解,我们可以将变分推理方法更紧凑地参数化,并提高其信噪比,从而加速其收敛速度。
PDF
4 years ago
ICML
基于随机梯度的无需投影的在线优化:从凸性到次模性
该论文提出了一种新颖的元 Frank-Wolfe 算法及其简化版 One-Shot-Frank-Wolfe,用于对在线优化进行全局和子模最优解的快速求解。其方法基于梯度下降实现,通过随机梯度估算和孪生逼近算法来降低收敛难度。
PDF
6 years ago
SARAH:一种使用随机递归梯度的机器学习问题新方法
本文提出了一种名为 SARAH 的随机递归梯度算法及其改进版 SARAH +,以优化有限累加和问题,并证明了该算法在强凸情况下具有线性收敛速率。
PDF
7 years ago
Prev
Next