关键词local minimum
搜索结果 - 7
- 理解非线性自监督学习的表示可学习性PDF6 months ago
- 随机梯度下降中的重尾现象PDF4 years ago
- 神经网络宽度对性能的好处:不良盆地的消失PDF6 years ago
- 如何随机地使梯度变小:更快的凸优化和非凸优化随机梯度下降PDF6 years ago
- MM随机梯度 Langevin 动力学的碰撞时间分析PDF7 years ago
- 归一化之力:更快速地逃离鞍点PDF8 years ago
- 比梯度下降法更快地找到局部极小值PDF8 years ago
Prev
Next