BriefGPT.xyz
大模型
Ask
alpha
关键词
coordinate-wise gradient estimation
搜索结果 - 1
DeepZero:扩展零阶优化以提升深度模型训练
DeepZero 是一个基于 Zeroth-order optimization 的深度学习框架,通过三个主要创新使得 ZO 优化可用于深度神经网络的训练,同时实现了与一阶优化相当的性能,其优点包括坐标梯度估计(CGE)在训练准确性和计算效
→
PDF
9 months ago
Prev
Next