BriefGPT.xyz
Ask
alpha
关键词
global convergence theory
搜索结果 - 3
关于编码器型浅层变换器的收敛性研究
该研究建立了关于编码器式浅层 Transformer 的全局收敛理论,从体系结构、初始化和在有限宽度范围内的缩放的角度进行了现实情景的探究。研究重点在于如何解决 Transformer 核心组成部分 softmax 的问题。研究表明,在实践
→
PDF
8 months ago
AAAI
使用 REINFORCE 的高效样本强化学习
研究了 RL 中的 policy gradient methods,建立了 REINFORCE 算法的全局收敛理论,围绕梯度估计和采样效率等方面进行了研究。
PDF
4 years ago
一种用于训练 $l_1$ 正则化线性分类器的分布式块坐标下降法
本研究设计了一种分布式算法来解决 $l_1$ 正则化问题,通过块优化和 Gauss-Seidel 算法更新,达到减少迭代次数和加速算法的目的,在全局收敛率方面得到了理论支持。实验表明,该方法比现有方法更快。
PDF
10 years ago
Prev
Next