BriefGPT.xyz
Jun, 2015
使用随机计算图估算梯度
Gradient Estimation Using Stochastic Computation Graphs
HTML
PDF
John Schulman, Nicolas Heess, Theophane Weber, Pieter Abbeel
TL;DR
通过引入随机计算图的形式化方法,该论文描述了如何自动推导损失函数梯度的无偏估计量,提出了一种计算梯度估计器的算法,从而统一了以前工作中推导的估算器和其中的方差减少技术,该算法使得研究人员可以开发涉及随机和确定性操作相结合的复杂模型,包括注意力、记忆和控制动作。
Abstract
In a variety of problems originating in supervised, unsupervised, and reinforcement learning, the
loss function
is defined by an expectation over a collection of random variables, which might be part of a
probabilistic
→