BriefGPT.xyz
Ask
alpha
关键词
discrete random variables
搜索结果 - 4
ICML
使用间隔的直通估计器训练离散深度生成模型
提出一种灵活的 Gapped Straight-Through (GST) 估计器来降低离散随机变量的梯度估计中的高方差,在 MNIST-VAE 和 ListOps 的两项离散深度生成建模任务中表现优异,比其他策略具有更好的性能。
PDF
2 years ago
ICLR
通过无放回抽样估计离散随机变量的梯度
本文提出了一种基于无重复抽样的离散随机变量期望无偏估计方法,将其与 REINFORCE 算法相结合,得到了具有内置控制变量的策略梯度估计器,并应用于多种任务得到了良好的效果。
PDF
4 years ago
基于期望目标的 GO 梯度
提出了一种可以应用于非可重参数化连续或离散随机变量的梯度计算方法(GO 梯度),并且具有与可重参数化方法相同的低方差,同时还开发了一种通过不同分布的传播链规则、将神经网络与常见随机变量相耦合的统计反向传播方法。
PDF
6 years ago
重新审视具有随机控制流模型的加权唤醒 - 睡眠算法
本文研究用于生成模型的随机控制流模型的学习问题,提出了一种基于重加权的 wake-sleep 算法,证明在学习 SCFMs 方面胜过其他现有的方法,是竞争力和优选的选择。
PDF
6 years ago
Prev
Next