Jul, 2024

CMR缩放法则:预测语言模型持续预训练的关键混合比

TL;DR本研究解决了大语言模型在特定领域表现欠佳的问题,提出了关键混合比(CMR)的概念,以优化一般语料和领域特定语料的混合比例。研究发现,CMR在训练效率和效果间保持平衡,提供了优化语言模型在特定领域训练的实用指南,确保模型在一般和领域特定性能上的最佳表现。