BriefGPT.xyz
Ask
alpha
关键词
tensor initialization
搜索结果 - 1
通过梯度下降学习具有一层 ReLU 的神经网络
本文研究从标准高斯分布采样输入,从嘈杂的教师网络生成输出的一层隐藏神经网络的学习问题。研究分析了梯度下降在基于经验风险最小化的训练中的性能,并提供了算法相关的保证,证明了张量初始化后跟随梯度下降可以以线性速率收敛到地面真值参数,证明本文是第
→
PDF
6 years ago
Prev
Next