BriefGPT.xyz
Ask
alpha
关键词
maximum-entropy distributions
搜索结果 - 2
神经网络学习逐渐复杂的统计规律
该研究指出神经网络首先学习数据分布的低阶矩,然后再学习高阶相关性。通过实验证据,证明了神经网络在训练早期会自动学习以最大熵分布为基础的低阶统计信息,但训练后期会失去这种能力。该研究还将分布简易偏差扩展到离散领域,并通过证明 Token 的
→
PDF
5 months ago
最大熵分布的高斯过程回归
最大熵分布、拉格朗日乘子、高斯过程、核函数和数据驱动的最大熵闭合问题的性能研究。
PDF
a year ago
Prev
Next