EMNLPNov, 2023

自我引导的数据重新加权用于语言模型预训练

TL;DR我们提出了 PRESENCE 方法,通过利用自我影响(SI)得分作为样本重要性和预训练的指标来共同重新加权样本,从而促进模型预训练的新颖性和稳定性,填补了在预训练语言模型中采用模型驱动的样本重新加权的重要领域的空白。