May, 2023

DoReMi: 优化数据混合加速语言模型预训练

TL;DR本篇论文介绍了一种名为 DoReMi 的方法,用于通过预训练数据域的混合比例来提高语言模型性能,该方法先使用集合分布稳健优化(Group DRO)对数据域进行小型代理模型训练来生成域权重,然后使用这些域权重对数据集进行再采样并训练更大的模型。在实验中,该方法提高了在所有域上的 perplexity ,并在几乎不增加训练步骤的情况下将平均 downstream accuracy 提高了 6.5%。