BriefGPT.xyz
Ask
alpha
关键词
total gradient variance
搜索结果 - 1
子采样不是魔法:大批量训练对差分隐私随机优化的作用
研究了批量大小对区分隐私随机梯度下降(DP-SGD)中的总梯度方差的影响,旨在理论上解释大批量大小的有用性。发现 DP-SGD 的总梯度方差可以分解为子抽样引起的方差和噪声引起的方差,并证明在迭代次数无限的极限情况下,噪声引起的方差与批量大
→
PDF
5 months ago
Prev
Next