Jul, 2024
小型语言模型能否学习、遗忘并保留噪声模式?
Can Small Language Models Learn, Unlearn, and Retain Noise Patterns?
Nicy Scaria, Silvester John Joseph Kennedy, Deepak Subramani
TL;DR该研究调查了小语言模型在学习、保留和消除通常不存在于互联网上的噪声方面的能力,并评估了四个小语言模型的表现在不同训练水平下,发现 Olmo 在任务上表现始终良好,即使它是参数最少的模型。