Oct, 2023

DoGE: 领域加权与泛化估计

TL;DR使用 DOmain reweighting with Generalization Estimation (DoGE) 方法,通过基于梯度的泛化估计函数来重新权衡每个领域的样本抽样概率,以达到最终泛化目标,从而提高大型语言模型的泛化能力。在 SlimPajama-6B 数据集上,DoGE 方法在普适泛化目标上获得了更好的平均困惑度和零样本推理准确性,同时在领域外泛化任务中,DoGE 显著降低了目标领域的困惑度。我们还应用了参数选择方案,提高了泛化估计的效率。