Nov, 2016

具体分布:离散随机变量的连续松弛

TL;DR该论文提供了一种通过引入Concrete随机变量的连续放松方法解决离散状态下无法使用重参数化技巧的问题,使得在离散计算图上也能有效地使用自动微分来产生低方差偏向梯度和低方差无偏梯度以优化损失函数。