BriefGPT.xyz
大模型
Ask
alpha
关键词
pythia llms
搜索结果 - 1
理解早期权重平均对大型语言模型训练的有效性
通过运用检查点平均化方法来改进大型语言模型(LLMs)的质量,在不增加额外培训或推理成本的前提下,缩短训练时间并提高测试和零样本泛化能力。
PDF
a year ago
Prev
Next