BriefGPT.xyz
大模型
Ask
alpha
关键词
online data mixing
搜索结果 - 1
语言模型预训练的高效在线数据混合
研究论文通过开发一种高效的在线数据混合算法(ODM),结合了数据选择和数据混合的元素,优化了训练过程中的数据混合比例,提高了大型语言模型的性能。
PDF
7 months ago
Prev
Next