Mar, 2024

通过融合高度专业化的语言模型,同时掌握文本、代码和数学

TL;DR我们提出了一种融合不同领域模型的框架,UltraFuser,通过引入令牌级别的门控机制以及两阶段训练策略,以高效稳定的方式训练模型,并构建了一个具有广泛话题覆盖的高质量训练数据集,UltraChat 2,在文本、代码和数学领域展现出高水平的性能。