May, 2024
数据集分解:使用可变序列长度课程进行更快的 LLM 训练
Dataset Decomposition: Faster LLM Training with Variable Sequence Length Curriculum
Hadi Pouransari, Chun-Liang Li, Jen-Hao Rick Chang, Pavan Kumar Anasosalu Vasu, Cem Koc...
TL;DR通过数据集分解、变长序列训练技术、性能增强等方法,实现了对大型语言模型的高效训练和提升。