BriefGPT.xyz
大模型
Ask
alpha
关键词
sparse learning strategy
搜索结果 - 1
SLTrain:一种用于参数和内存高效预训练的稀疏低秩方法
通过在预训练中将权重参数化为低秩和稀疏矩阵之和,我们提出了一种称为 SLTrain 的方法,它通过矩阵分解学习低秩部分,然后使用随机固定支撑稀疏学习策略学习非零条目,这种策略显著提高了预训练性能。与低秩参数化预训练相比,SLTrain 几乎
→
PDF
a month ago
Prev
Next