BriefGPT.xyz
Ask
alpha
关键词
learning trajectory
搜索结果 - 4
超叠波 toy 模型中的动力学与贝叶斯相变
通过奇异学习理论,我们研究了超位叠加玩具模型中的相变。我们导出了理论损失的闭合公式,并在两个隐藏维度的情况下发现正则 k - 边形是临界点。我们提出了支持理论,表明这些 k - 边形的局部学习系数(一种几何不变量)决定了贝叶斯后验随训练样本
→
PDF
9 months ago
神经网络梯度下降训练中的普适性尺度律
本文通过对梯度下降训练的神经网络的优化轨迹进行研究,展示了学习轨迹可以用大训练时间的显式渐近特征描述。
PDF
3 years ago
多层神经网络均值场极限的严格框架
本研究发展了多层神经网络的数学严格框架,探究其在平均场条件下的学习轨迹,并证明了一些神经网络的性质,包括全局收敛性和初始化的影响。其中的新概念包括概率嵌入和双向多样性。
PDF
4 years ago
干扰特征下的抽象推理
本文提出了一种功能强大的 FRAR 模型,该模型使用有计划的学习轨迹对训练数据进行分类,从而有效地提高学习性能,超过了基线算法,并在 RAVEN 数据集中击败了最先进的模型 18.7% ,在 PGM 数据集中击败了 13.3%。
PDF
5 years ago
Prev
Next