BriefGPT.xyz
Ask
alpha
关键词
loss function symmetries
搜索结果 - 1
随机梯度下降法的平衡定律和稳定分布
随机梯度下降(SGD)算法是用于训练神经网络的算法。在这项工作中,我们证明了 SGD 的小批量噪声在有缩放对称性的损失函数中使解决方案朝着均衡解决方案正则化。我们应用这一结果来推导具有任意深度和宽度的对角线线性网络的随机梯度流的稳态分布,该
→
PDF
a year ago
Prev
Next