BriefGPT.xyz
大模型
Ask
alpha
关键词
gradient annealing
搜索结果 - 1
AUTOSPARSE: 深度神经网络稀疏训练自动化
本文提出通过渐进式变化策略的梯度退火(gradient annealing,GA)以及最新的可学习剪枝方法相结合的自动稀疏训练算法 AutoSparse,在 ImageNet-1K 数据集上表现优异,80% 稀疏 ResNet50 的训练和
→
PDF
a year ago
Prev
Next