BriefGPT.xyz
Ask
alpha
关键词
goldilocks zone
搜索结果 - 3
神经网络初始化中的金发女郎区域解构
这篇论文通过对深度学习模型的优化动力学进行全面分析,探讨了训练损失的二阶性质对模型的影响,特别关注了与高度可训练的初始点相关联的 “Goldilocks zone” 概念,提出了正曲率对深度网络的可训练性的重要性,并讨论了与模型自信度、初始
→
PDF
5 months ago
理解 Grokking:表示学习有效理论的探究
通过微观分析和宏观相图描述学习性能,本研究发现,泛化是由结构化表示产生的,这些表示的训练动态和对训练集大小的依赖性可以在玩具环境中通过有效理论进行预测。同时,我们观察到四个学习阶段:理解、深度理解、记忆和混淆。此外,本研究还发现,表示学习仅
→
PDF
2 years ago
ICML
高瑞德区间:走向更好的神经网络损失函数景观理解
通过在低维度的超平面和超球面上评估代价函数的海森矩阵,我们发现全连接神经网络和卷积神经网络的代价函数在它们的空间参数半径较大的固定范围内,具有异常的凸性和正曲率,此处我们称之为 “金发姑娘区间”,该效应与神经元网络的初始化方法,包括公共初始
→
PDF
6 years ago
Prev
Next