BriefGPT.xyz
大模型
Ask
alpha
关键词
stochastic estimator
搜索结果 - 2
一种深度神经网络低比特宽度训练的统计框架
本论文提出了一个用于分析全量化训练算法的统计框架,并探讨了梯度量化对其收敛性的影响。作者开发了两个新的梯度量化器,并展示了这些量化器相对于现有的每个张量量化器具有更小的方差。
PDF
4 years ago
Danskin 定理在无导数最小极化优化中的应用
本文提出了一种使用进化策略作为梯度估计器的黑盒极小极大问题的求解方法,并在实验中展示了该方法的有效性。
PDF
6 years ago
Prev
Next