Dec, 2023

语言模型预训练的高效在线数据混合

TL;DR研究论文通过开发一种高效的在线数据混合算法(ODM),结合了数据选择和数据混合的元素,优化了训练过程中的数据混合比例,提高了大型语言模型的性能。