BriefGPT.xyz
Ask
alpha
关键词
learning rate adaption
搜索结果 - 2
ELRA: 指数学习率自适应梯度下降优化方法
我们提出了一种新型的、快速的、基于梯度的优化算法,通过情景感知来自适应学习率,以正交邻近梯度为主要思路。该方法具有快速收敛速度,不依赖手动调参参数,具有更大的普适性,在维度 n 为任意大小的问题上可线性扩展。通过在 MNIST 基准数据集上
→
PDF
10 months ago
利用方差迁移和学习速率自适应增量式生长神经网络加速训练
通过考虑参数化和优化策略对训练动态的影响,我们开发了一种高效增长神经网络的方法,该方法动态稳定权重、激活和梯度缩放,提出一种学习率适应机制来解决不平衡训练问题,并取得了与训练大型固定模型相当或更好的准确性和训练速度加快。
PDF
a year ago
Prev
Next