BriefGPT.xyz
大模型
Ask
alpha
关键词
dp-sgd variant
搜索结果 - 1
非可分目标函数的 DP-SGD
使用新的 DP-SGD 变体解决相似性损失函数的梯度敏感度随着批量大小增长而增加的问题,并在 CIFAR-10 预训练和 CIFAR-100 微调任务中得到了与非私有模型接近甚至优于直接应用于相似性损失的 DP-SGD 的性能。
PDF
9 months ago
Prev
Next