BriefGPT.xyz
Ask
alpha
关键词
gradient problems
搜索结果 - 2
EANet: 在线轨迹预测的专家注意力网络
基于 Hedge Propagation 算法的启发,我们提出了 Expert Attention Network,它是一种完整的在线学习框架,用于轨迹预测。我们引入了专家注意力机制,通过调整不同深度网络层的权重,避免了由于梯度问题导致模型
→
PDF
10 months ago
HSIC 瓶颈:无需反向传播的深度学习
介绍了使用 HSIC 瓶颈训练深度神经网络,它可以缓解爆炸和消失梯度的问题,实现了在没有跳跃连接的情况下学习非常深的网络,而且在不需要对称反馈或更新锁定的情况下,可以获得 MNIST / FashionMNIST / CIFAR10 分类等
→
PDF
5 years ago
Prev
Next