BriefGPT.xyz
大模型
Ask
alpha
关键词
factual knowledge acquisition
搜索结果 - 1
大型语言模型在预训练期间如何获取事实知识?
通过研究大型语言模型在预训练过程中获得事实知识的机制,发现预训练数据量的增加并不显著提高模型获得和保持事实知识的能力,训练步骤与记忆遗忘和事实知识的泛化之间存在幂律关系,重复训练数据会导致遗忘加速,而使用更大的批量大小有助于提高模型的遗忘鲁
→
PDF
17 days ago
Prev
Next