BriefGPT.xyz
Ask
alpha
关键词
wide networks
搜索结果 - 3
ICLR
宽神经网络的线性转换是由组装弱模型的新性质
该论文探讨了宽神经网络与线性输出层的关系,并发现它们在梯度下降的优化路径区域中几乎是线性的,并且有几乎恒定的神经切向核。通过递归地构建由一组子模型组成的神经网络装配模型的方法,该论文提出了一种新的视角解释宽神经网络的线性结构。
PDF
2 years ago
费曼图中宽网络的渐进行为
本文介绍了一种基于费曼图的分析大宽度行为的方法,并将其应用于研究网络训练动力学,通过推导新的结果和改进现有界限来推导宽网络演化。
PDF
5 years ago
神经网络宽度对性能的好处:不良盆地的消失
本文证明了从窄网络到宽网络的过渡存在一个相变,窄网络存在次优盆地(sub-optimal basins),而宽网络不存在。具体地,采用连续激活函数的一类宽网络损失曲面没有亚优盆地,但是对于宽度低于阈值的大类网络,存在不是全局最小值而是严格局
→
PDF
6 years ago
Prev
Next