BriefGPT.xyz
Ask
alpha
关键词
stochastic softmax tricks
搜索结果 - 2
离散连续计算图的高效学习
通过增加 Gumbel 噪声扰动的规模参数和引入特定于随机离散 - 连续计算图的 dropout 残差连接,可以训练复杂的离散 - 连续模型,且其泛化能力优于连续模型。
PDF
a year ago
随机 Softmax 技巧的梯度估计
在扰动模型框架下,我们使用随机 softmax 技巧(stochastic softmax tricks)对 Gumbel-Softmax 技巧进行了推广,将其推广到组合空间。与基线相比,我们发现使用随机 softmax 技巧可以训练表现更
→
PDF
4 years ago
Prev
Next