BriefGPT.xyz
大模型
Ask
alpha
关键词
gumbel-softmax estimator
搜索结果 - 3
重温使用 Gumbel-Softmax 的 MADDPG 算法
本文探讨了在离散动作空间的场景下,使用多种代替 Gumbel-Softmax 估计器的方法来扩展 MADDPG 算法,并对各种性能指标进行了测量和分析,结果表明,在几项任务中,其中一种提出的估计方法比原始的 Gumbel-Softmax 在
→
PDF
a year ago
Rao-Blackwell 算法优化直通 Gumbel-Softmax 梯度估计器
本研究提出了一种对 Gumbel-Softmax estimator 进行 Rao-Blackwellization 的方法,可在不增加函数评估数量的情况下减少方差,从而降低均方误差,并在两种无监督潜变量模型中得到了实证验证。
PDF
4 years ago
HMQ: 用于卷积神经网络的硬件友好型混合精度量化块
本文提出了 HMQ,一个基于 Gumbel-Softmax 估计器的混合精度量化块,搜索有限的量化方案空间,以覆盖在边缘设备硬件实现中需要的均匀和具有 2 的幂级别阈值的量化器需求,并在 CIFAR10 和 ImageNet 训练的分类模型
→
PDF
4 years ago
Prev
Next