Jul, 2023

Skill-it!一种基于数据驱动的技能框架用于理解和训练语言模型

TL;DR使用具有固定标记预算的新框架,通过学习一组语言模型的技能顺序,从而在任务间提升下游模型性能,减少数据训练量,并引入一种在线数据采样算法 Skill-It,以实现连续预训练和微调中多个技能的高效学习。