Nov, 2023

利用 CatLog 导数技巧对分类分布进行可微分抽样

TL;DR我们提出了 CatLog-Derivative 技巧,该技巧针对分类分布,并用于引入 IndeCateR,一个新颖且无偏的梯度估计器,具有比 REINFORCE 更低方差的重要独立分类分布产品情况,并通过实验证明同样数量的样本下 IndeCateR 的梯度估计具有显著较低的偏差和方差。