BriefGPT.xyz
Ask
alpha
关键词
directional derivatives
搜索结果 - 3
如何猜测梯度
神经网络的梯度具有比以前认为的更多结构,研究中探讨了梯度在可预测的低维子空间中的特点以及如何利用这种结构改进基于方向导数的无梯度优化方案。同时,突出了在最大程度地减小准确梯度计算方法和猜测梯度方法之间的优化性能差距方面所面临的新挑战。
PDF
7 months ago
用于优化算法的随机前向模式自动微分
神经网络的反向传播过程利用了自动微分的基本要素,通过前向模式的自动微分或 Jacobian 向量乘积 (JVP) 来计算损失函数的方向导数,并使用随机采样的不同概率分布计算这些方向导数,本文对这些方法进行了严格的分析并给出了收敛速率,同时还
→
PDF
8 months ago
深度神经网络中的节点扰动有效学习
Backpropagation (BP) is the dominant method for training deep neural networks, but node perturbation (NP) proposes learn
→
PDF
9 months ago
Prev
Next