Oct, 2024

优化低资源语言模型训练:多轮次、多语言和两阶段方法的综合分析

TL;DR本研究解决了在低资源语言的情况下,优化大型语言模型训练配置的问题。通过对多轮次、多语言和两阶段训练方法的结合进行深入探索,提出了有效的超参数搜索成本降低策略。研究发现,目标语言语料量的减少会导致最佳训练方法的变化,从单语单阶段训练转向多语两阶段训练,并且最佳模型规模在不同语料量下保持稳定。