BriefGPT.xyz
Ask
alpha
关键词
relu function
搜索结果 - 2
NIPS
用于训练 Tikhonov 正则化深度神经网络的收敛块坐标下降算法
本文提出了一种用于训练深度神经网络的光滑的多凸形式,该方法利用了凸分析中的近端点方法,开发了一个块协调下降(BCD)训练算法,证明了其具有全局收敛性和 R - 线性收敛速率,并在实验中展示了优于 Caffe 工具箱中所有随机梯度下降(SGD
→
PDF
7 years ago
深度网络与浅层网络:逼近论视角
本文回顾了最近关于层级神经网络结构的研究成果,探讨了深度卷积神经网络优于浅层神经网络在函数近似问题中的表现条件。本文提出了一个新的对于相对维度的定义,该定义可以被深层网络而非浅层网络使用以显著降低近似和学习所需的复杂度。同时,本文还宣布了关
→
PDF
8 years ago
Prev
Next