BriefGPT.xyz
Ask
alpha
关键词
low-order moments
搜索结果 - 2
神经网络学习逐渐复杂的统计规律
该研究指出神经网络首先学习数据分布的低阶矩,然后再学习高阶相关性。通过实验证据,证明了神经网络在训练早期会自动学习以最大熵分布为基础的低阶统计信息,但训练后期会失去这种能力。该研究还将分布简易偏差扩展到离散领域,并通过证明 Token 的
→
PDF
5 months ago
重尾巴下的损失最小化和参数估计
该论文研究了一种简单估计技术在重尾分布下提供指数集中性的应用和推广,证明该技术可用于平滑强凸损失函数的近似最小化,特别是在最小二乘线性回归、稀疏线性回归和低秩协方差矩阵估计中具有类似的特征。
PDF
11 years ago
Prev
Next