BriefGPT.xyz
Ask
alpha
关键词
large deviations theory
搜索结果 - 2
加速神经网络训练的大偏差
本文介绍了一个基于大偏差原理的新型人工神经网络训练方法 LAD Improved Iterative Training,该方法使用 Modified Training Sample(MTS)作为训练样本,采用异常得分为基础的采样策略,能更加
→
PDF
a year ago
拟势函数作为随机梯度下降中损失函数的隐式正则化器
本研究利用变分推理和大偏差理论对随机梯度下降进行分析,提出了一个新的潜在函数模型,并探讨了噪声协方差结构对 SGD 的影响及其在隐式正则化中的作用。
PDF
6 years ago
Prev
Next