Feb, 2024

小型语言模型能为较大语言模型选择调整训练数据

TL;DR通过基于样本学习百分比的训练数据选择,我们展示了当前语言模型具备自主选择高质量训练数据的能力,这极大地降低了训练成本且达到或超过整个数据集训练的性能表现。