BriefGPT.xyz
Ask
alpha
关键词
rnn training
搜索结果 - 2
梯度抛光:通过动态控制雅可比矩阵来改进梯度下降
通过调节 Lyapunov 指数来稳定梯度并提高循环神经网络 (RNN) 训练的有效性,减缓梯度爆炸和梯度消失问题。
PDF
6 months ago
ICML
并非所有样本都是相等的:使用重要性采样的深度学习
本研究提出了一种基于重要性采样的计算优化方案,该方案能够减少深度神经网络训练过程中冗余计算,提升模型的训练效果并有效降低损失。实验结果显示,该方案能够在相同的时间预算下,将训练损失降低一个数量级,并提高测试误差 5%至 17%。
PDF
6 years ago
Prev
Next