BriefGPT.xyz
Ask
alpha
关键词
straight-through estimator
搜索结果 - 3
EMNLP
理解 SPIGOT 的机制:用作潜在结构学习的替代导数
本文讨论了拉回下游学习目标方法来探索潜在结构学习的原理,从而发现了 STE 和 SPIGOT 的原则动机,这导致了相同家族中的新算法,并将已知的和新的拉回估计器与流行的选择进行了实证比较,为实践者提供了新的见识,并揭示了有趣的失败案例。
PDF
4 years ago
ICLR
理解直通估计在训练激活量化神经网络中的作用
通过学习使用 STE 实现反向传播算法中的梯度下降,通过正确选择 STE 并验证其梯度与总体梯度正相关,进而解决了搜索负方向最小化训练损失的问题。研究还比较了不同 STE 算法对 CIFAR-10 数据集的训练结果和稳定性。
PDF
5 years ago
IJCAI
无 STE 学习低精度神经网络
该论文提出了一种 alpha-blending 替代 Straight-Through Estimator 的方法用于量化神经网络,该方法逐步将模型从全精度转化为低精度并在 CIFAR10 和 ImageNet 数据集上表现出更好的结果。
PDF
5 years ago
Prev
Next