BriefGPT.xyz
Ask
alpha
关键词
zeroth-order method
搜索结果 - 2
规模化大型语言模型微调的差分隐私零阶方法
本文研究了差分隐私零阶方法在预训练语言模型中的潜力,通过近似梯度避免了 SGD 的可扩展性瓶颈,并提出了动态调度超参数的阶段性差分隐私零阶方法和减少可训练参数的数据无关剪枝技术,从理论和实证分析了这两种方法的效果。
PDF
5 months ago
AAAI
快速无梯度近端随机非凸非光滑优化方法
本文提出了两种新的零阶近端随机优化算法 ZO-ProxSVRG 和 ZO-ProxSAGA,它们利用了 SVRG 和 SAGA 的方差缩减技术,并证明了它们具有线性 $O (rac {1}{T})$ 的收敛速度,实验结果表明相比于现有的零阶
→
PDF
5 years ago
Prev
Next