Jul, 2024

RegMix: 以数据混合作为语言模型预训练的回归方法

TL;DR使用回归模型自动识别高性能的数据混合,通过联合所有领域一起考虑以捕捉复杂性,RegMix 方法超过人工选择,并且仅使用 10%的计算预算实现与 DoReMi 相比匹配或更好的结果。