BriefGPT.xyz
May, 2013
通过随机神经元估算或传播梯度
Estimating or Propagating Gradients Through Stochastic Neurons
HTML
PDF
Yoshua Bengio
TL;DR
本文介绍了如何通过两种方法解决通过随机神经元的输入推算出相应梯度的问题,并提出了一种可行的解决方法,可应用于梯度估计与强化学习中,同时提出了一种新型硬判定单元的高偏差、低方差梯度估计方法,可用于实现稀疏表示和稀疏梯度。
Abstract
stochastic neurons
can be useful for a number of reasons in
deep learning
models, but in many cases they pose a challenging problem: how to estimate the gradient of a loss function with respect to the input of su
→