Mar, 2023
使用非监督领域发现技术扩展专家级语言模型
Scaling Expert Language Models with Unsupervised Domain Discovery
Suchin Gururangan, Margaret Li, Mike Lewis, Weijia Shi, Tim Althoff...
TL;DR采用异步训练、领域发现及专家语言模型等方法,针对大规模稀疏语言模型进行了研究,实现了高效的语言模型训练。实验结果表明,针对语料库的聚类分析和专家模型的培训对于提升模型性能至关重要。