BriefGPT.xyz
Ask
alpha
关键词
multi-index target functions
搜索结果 - 1
重用梯度下降批次在两层网络中的好处:打破信息与跳跃指数的诅咒
使用两层神经网络学习多指标目标函数时,我们研究了训练动态。我们关注多次梯度下降(GD)使用多次批次并显示它显著改变了对可学习功能的结论,与单次梯度下降相比。特别是,我们发现具有有限步长的多次 GD 能够克服目标函数的信息指数(Ben Aro
→
PDF
5 months ago
Prev
Next