BriefGPT.xyz
Ask
alpha
关键词
doremi
搜索结果 - 1
DoReMi: 优化数据混合加速语言模型预训练
本篇论文介绍了一种名为 DoReMi 的方法,用于通过预训练数据域的混合比例来提高语言模型性能,该方法先使用集合分布稳健优化(Group DRO)对数据域进行小型代理模型训练来生成域权重,然后使用这些域权重对数据集进行再采样并训练更大的模型
→
PDF
a year ago
Prev
Next