BriefGPT.xyz
Ask
alpha
关键词
optimisation methods
搜索结果 - 3
从表现到认知体系结构:一个可扩展的框架
通过将现实解读为信息源,并将其转化为计算框架,我们提出了一种新颖的建模方法,从而接近于人工通用智能。该框架可以以流动可扩展的分层方式构建经典的认知架构元素,如长期记忆和工作记忆。
PDF
22 days ago
两层网络训练中的早期对齐是双刃剑
使用一阶优化方法训练神经网络是深度学习实验成功的核心。在小的初始化下,训练动力学的早期阶段会导致神经元朝关键方向对齐,从而引发网络的稀疏表示,这与渐近梯度流的隐式偏差相关。然而,这种稀疏诱导的对齐会导致在最小化训练目标上面临困难,我们还提供
→
PDF
6 months ago
相对论蒙特卡罗
提出了基于相对论动力学的哈密顿蒙特卡罗方法,通过引入粒子的最大速度解决哈密顿蒙特卡罗在大时间离散化和空间几何不匹配时的性能问题,并开发了基于此的相对论随机梯度下降算法,与深度学习中的优化方法如梯度截断、RMSprop、Adagrad 和 A
→
PDF
8 years ago
Prev
Next